网上看了篇文章,觉得很不错,抄在下面。因原文没注明作者,在这也不知道作者是谁了。
rW#T
vUn N)Z?Z+}h L4l!96]a 编程概述
#|``ca54B /wlEe>i 编程术可以看作实用魔法的一个分支。编程魔法师用时间和精力做祭品,与生活在计算机中的精灵订立契约,以换取驾驭代码的能力。
B|X!>Q<g ---fmddlmyy
LXCx~;{\
{7pli{` 要提高编程水平,唯有多看多写。这篇文章看似经验之谈,实质还是灌水。本次灌水,拟定了以下几个主题:
D3K8F@d 3
8`<:{^Y § 编程概述
xd0 L{ue. k|f4Cf, § 软件开发中的方法论
%N_%JK\{@ {f p[BF § 编程实践
^dxTm1Z 8a"%0d# § 嵌入式编程的特点
xe$_aBU ,"0:3+(8; 编程概述
EB|}fz S5EK~#-L[ 本文将从不同角度讨论 “ 什么是编程 ” ,或者 “ 什么是编程的本质问题 ” 。这些讨论并不是要得出什么定义,我们实际上是在表述各种编程思想,以期加深对编程的理解。
?Ss!e$jf \lNN Msd& 1 编程不是艺术
-35;j'a /_ajaz% 我们的世界是模糊的、连续的、不精确的,但软件是精确、离散的、形式化的,这就注定了软件不能完全描述现实世界。因此我们需要知道描述哪些部分,忽略哪些部分,这就是软件的本质问题。
A+?`?pOm& --- Tom Demarco
Uoix BfiD9ka-z 编程不是艺术。编程不追求完美,它的目的是解决问题。
~7Ux@Sx; yEQs:v6L~ 和艺术上的 “ 只能意会,不可言传 ” 相反,编程甚至不能忍受自然语言的模糊性,它要求问题被表述成可编译、可运行的代码,文字和图表只是辅助交流的工具。
/2VJX@h 9-m=*|p 每个程序员有两个面具:职业的和专业的。戴上职业面具后,程序员会用能找到的最好用的工具,以尽可能简单的方式,在合理的成本内解决问题中必须解决的部分。
Qe(:|q_ ku
M$UYTTX 而戴上专业面具的程序员,会不厌其烦地学习各种编程知识(很多都不是职业需要的),积累经验值,吸收可复用的模式和思想。他们会用大量时间去理解程序的表象和 CPU 的汇编代码之间究竟发生了什么。他们有着探索未知领域和练功升级的强烈欲望。
0Wp|1)ljA mRK>U$v 他们在不断接近技艺的完美,而这个技艺本身是以不谈完美、但求有效的方式解决问题。他们付出了大量的努力,而这些努力的驱动力是好奇心和进取心。如同《魔法学徒》中描述的魔法师,一个魔法师所追求的东西只有志趣相投的魔法师才能理解,而不管他们出于哪个阵营。了解事物真相本身带来的满足就可以作为一切努力的回报,
G .4X' T&7qC=E#5 2 控制复杂性
zp?`N; 11;zNjD| 任何一个正在构建大型系统的人,天天面对的中心议题就是:如何剔除不必要的、人为的、自找的复杂部分,并控制好剩下的,无可逃避的复杂性。
J<lO=
+mg --- Betrand Meyer
oe~b}: f(7GX3? 编程可以被看成一种管理工作,管理的对象是代码,控制的对象是代码的复杂性。
*}W_+qo" Jj%K=sw 中国的传统思维比较喜欢谈本质,追求一种称作 “ 道 ” 的东西。而在编程上,表象和本质同样重要。所有程序说到底不过是一些汇编语句的组合,但了解这个本质在大多数场合都不能有助于解决实际问题。
""~ajy Yu2Bkq+ 写代码是为了解决实际问题。当代码的数量增加到一定程度,对代码自身的控制也会成为一个重要的问题。数量改变了本质。
ht}wEvv uFga~g 管理的要诀是削弱、孤立被管理的对象, “ 使民无知 ” , “ 使民 ”“ 鸡犬之声相闻 ” 却 “ 至老死 ” 而 “ 不相往来 ” 。每个被管理的对象在完成自身工作的前提下,对其它对象的了解应当尽可能少。通过尽量降低对象间的耦合程度来控制复杂性。
#gw]'&{8D /;
85i6 只有有效地控制复杂性,我们才能使用越来越大的信息块,驾驭越来越多的代码,用这些 0 和 1 的操作去实现前人没有,甚至无法完成的工作。
IV)j1 jmW7)jT8: 3 复用
n'6jou Yc*;/T} 编程技艺的核心是代码的复用。复用已有的知识是积累、提高的前提,否则就会像谁谁谁那样每天推石头上山,而不能累进。在上帝看来,重复是一种惩罚的手段。
K\c#ig iO;
7t@]- 编程这个职业知识更新比较快,可以学习的东西也很多。有些人觉得累,但有些人却觉得其乐无穷,觉得从事这个职业是很幸运的事情。
,~W|]/b<q FJ?IUy 6 编程的实质是建筑,根据应用的需求,不断建筑更大的信息块。我们所写的所有程序,都可以被看作对语言的扩充。事实上,我们在不停地开发新的语言,我们所写的每个函数、每个类都是在为现有语言增加新的功能。我们按照适合特定应用的模式,组合各种信息块,完成实际的应用。这些信息块有的是我们自己做的,有的是拿来的。
Q#zmf24W _v]MsT-q 信息块可以被组合的关键就是简单、明确的接口。所以,我们应当针对接口编程,而不是针对应用编程。应用意味着变化和不可复用。将应用合理分解为模块,定义好模块间的接口,然后按照接口构建模块。模块分解的原则是:
\xoP)Ub> u\nh[1)a) § 模块的耦合程度尽可能得低(有人称此为最少知识原则);
^pk7"l4Xm <p"iY}x[H § 接口尽可能简单(有人称此为接口隔离原则);
z*)T%p "g8M0[7e3 § 如果将变化的因素封装到模块中,每个模块应该只封装一个因素(有人称此为单一责任原则);
X!g#T9kG Uf+%W;} § 使特定于应用的代码尽可能得少 。
Q&bM\;Ml ]e@Oiq 针对接口编程的好处有两个方面:
Pk)1WK7E QP J4~ § 信息块可以被复用;
\dQNLLg/ geCM<] § 复杂性可以被更好地控制。
K",N!koj r]36zX v 人们用各种方式复用知识,其实 C 语言本身又何尝不是知识的复用呢?其它复用方式包括:库函数、新的语言和编译器、新的脚本、类库、程序框架、设计模式、面向对象、面向组件、面向服务、面向方面、面向领域、各种开源代码、开发环境提供的各种 Wizard 和糖衣、各种代码生成工具等等。充分了解编程环境,善于复用各种资源,是程序员的基本功。
jrh43
\$* v/=}B(TDF Ooy7*W'; wLr_-vJ 软件开发中的方法论
)53y
AyP Mf``_=K uu687|Pm H$4:lH&( 1 项目管理的方法论
h 9W^[6 1.1 方法论
lnR{jtWP 方法论的英文为 Methodology ,编程的方法论应该是指软件开发的一整套方法、过程、规则、实践、技术。不过我们一般提到的方法论都偏重于项目、过程和人员的管理。
L*JjG sTH 5`: Yye 《 Agile Software Development 》的作者 Alistair Cockburn 提出方法论具有以下要素:角色、个性、技能、团队、技术、活动、过程、产品、里程碑、标准、质量、工具、团队价值,它们的关系可以用一幅图来表示:
#>+ HlT Y:a]00&)#Y
f&
' 4HA<P6L 虽然将这幅图贴在这里,事实上我不了解这些要素及其关系的确切定义,对于这些不能精确描述的东西,我接受起来比较困难。
A3@6N( cExS7~* 其实,项目管理的核心是沟通和反馈。只要能够保证良好的沟通和即时的反馈,开发团队即使并没有采用先进的方法论,一样可以成功。从另一个角度说,过程和工件能辅助,但不能保证开发人员、项目经理和客户的良好交流。
*;*r8[U}q PwLZkr@4^ 1.2 重型方法
J-hbh 有的方法论规定了大量的中间文档和复杂的过程管理。那些中间文档被称为 artifact ,或工件。需要大量 artifact 和软件开发方法被称作重型( Heavy Weight )方法。
&:)Wh[ 83q6Sv 这些复杂的方法来源于恐惧。
^y%T~dLkp' V "h
+L7T 在中大型的项目中,项目经理往往远离代码,他们无法有效的了解目前的工程的进度、质量、成本等因素。为了克服未知的恐惧感,项目经理制定了大量的中间管理方法,希望能够控制整个项目,最典型的莫过于要求开发人员频繁地递交各种报告。重型方法中的基本假设是过程(及各种 artifact )比个人可靠。
@;RXLq/8 o"#\
> 虽然很多轻型方法都将重型方法作为反面例子,但对于大多数大型项目,重型方法是管理所必需的。
OI*Xt` 4r}8lpF_( 1.3 轻型方法
vRO
_Q? 为了解决重型方法存在的问题,业界出现了很多轻型( Light Weight )方法论。提出这些方法论的部分作者结成了一个联盟:敏捷软件开发。他们还有一个宣言:
wAW5
Z0D ?5
7Sk+ § Individuals and interactions over processes and tools.
I2 P@L?h D d</`iUq § Working software over comprehensive documentation.
9q[oa5INd z' >_Mc6 § Customer collaboration over contract negotiation.
kW&TJP+5* E~oOKQ5W § Responding to change over following a plan.
Ek]'km! )+ 2hl 在这些宣言后面还有很多原则。概括起来主要是:尊重个人,强调沟通和反馈,与客户紧密合作,保持设计的简单性等等。敏捷方法在重型方法论和无管理状态之间寻求一个平衡点,希望用低成本的管理活动带来最大的产出。
Jg|XH
L) emN*l]N 2 编程的方法论
}9fTF:P 作为程序员,我更感兴趣的是可以指导编程的方法论。
dlTt_. ) hfpwdQ 2.1 测试驱动开发
u4h4.NHX 2.1.1 未谋进,先谋退
<W $mj04@ 在开始一件事情之前,必须先明确什么时候可以停止。什么 “ 止于至善 ” ,在编程工作中可以一脚踢开。我们必须明确要做什么,做到什么样子就算完成了。
k+pr \d ~ `+Q%oj#FF 怎样才算明确呢?最理想的方法是先写一个测试程序,然后再编写代码,让测试通过。测试程序规定了停止的必要条件。
]GQG~H^ #O dJ"1A| 测试程序是针对接口编写的。要写出测试程序,必须先定义好接口,然后针对接口编程。测试程序同时示范了接口的使用。
*bA.zmzM O@C@eW# 如果有一个运行很方便的测试程序,我们在维护代码时,就放心得多。可以经常跑一跑,测试一下,以保证测试要求的功能还没有被破坏。相反,如果没有测试程序,我在修改代码的 bug 时,心里就很不踏实,因为我不清楚我的修改是否会引入新的 bug 。
E=!\z%4 .OY`Z)SS% 2.1.2 保持可运行,可调试的状态
@6T/Tdz “ 先写测试程序 ” 适合没有 UI ,功能相对简单的模块。对于功能复杂的软件系统,需要测试的方面很多,测试时间很长,在开发前就建立一个比较全面的测试,并且随时使用,有时是不可能的。
ikiypWq >V}#[ /n 但我们至少应该保证:写任何程序,都要尽量保持在可运行、可调试的状态。即使要为此写一些额外的程序,都是值得的。在不能运行的情况下,编写大量代码是不可思议的事情。
V33T+P~j :G%61x&=Zc 2.1.3 可测试性
wDe& 1(T^ IC 设计上有一个 “Design For Test” 的说法,即 IC 的设计中必须要考虑到如何测试,留好测试的接口。软件开发也是一样的,我们写每段代码,都要考虑一下这段代码是否可以测试,为了保证可测试性,必要的时候可以修改设计。
}Kbb4]t|" B,epzI 2.2 重构
v
z '&%( 《重构》这本书内容朴实、但对我个人影响很大。在了解 “ 两顶帽子 ” 和 “ 小步前进 ” 的方法后,我敢于修改任何代码,甚至是我不熟悉底层逻辑的代码。
0.k7oB;f(@ W|63Ir67 2.2.1 两顶帽子
7E~;xn; 我们有两顶帽子:一顶是不改变功能的前提下,改善现有现有程序的设计;另一顶是增加新的功能,以适应需求变化。我们在任意阶段,应该只戴一顶帽子,绝对不能同时戴两顶帽子。
fS78>*K wi6
~}~% 在增加新功能的时候,往往需要先改进现有的代码结构,使之能更好地适应变化。如果功能有较大变动,我们应该将这变动分解成尽可能小的步骤,并让改进代码和新增功能的小步骤交替进行。将原有代码平滑地演变到新代码,既增加了功能,又改善原有代码的设计。
j+
0I-p VS8Rx.? 重构的正式定义应该是 “ 在代码写好之后改进它的设计 ” 。但对我而言,重构的思想已经融入了我的开发过程。在开发中,我同样按照 “ 两顶帽子 ” 和 “ 小步前进 ” 的方针平滑地演变代码,从无到有,逐步完善。
]-/VHh
}?Ai87-{ 2.2.2 代码的坏味道
-C?ZB}` 重构的对象是消除 “ 代码的坏味道 ” ,保持新鲜、健康的代码。《重构》中列举了一些典型的坏味道,例如重复代码、太长的函数、太长的参数列等等。
L0WN\|D b!5~7Ub.No 2.2.3 设计和重构
a HR"n|7{ 存在这么一种说法: “ 设计不再是一切动作的前提,而是在整个开发过程中逐渐浮现出来 ” 的。
y/ef>ZZ Gu\q%'I 事实上,在没有任何软件工程理论的时代,编程基本上是写到哪儿算哪儿。历史是螺旋上升的,在投影上很接近的两个点在铅垂线方向上是处于不同高度的。
!."D]i; M:B=\&.O 重构是要纠正过度设计的倾向,告诉程序员:即使开始的设计有缺陷,也没关系,更不要僵化地保持,我们可以重构代码,平滑地修改原有设计。这并不是说前期设计不重要。
338k?nHxv e h?zNu2= “ 设计是在整个开发过程中逐渐浮现出来 ” ,这是在说随着开发的深入,我们会对很多问题考虑地更加清楚。在必要的时候,我们应该用重构的方法灵活地改变设计,适应变化。
P?of<i2E ExL0?FemWV L>4"( +OWX'~fd< 'kO!^6=4M lp%pbx43s 编程实践
ZeaA%y67U 鸠集遗失,鉴玩整理,昼夜精勤,每获一卷,遇一画,毕孜孜葺缀,竟日宝玩,可致者必货敝衣 , 减粮食。妻子童仆切切嗤笑,或曰:终日为无益之事何补哉。既而叹曰:若复不为无益之事,则安能悦有涯之生。
CN8Y\<Ar --- 唐 张彦远 《历代名画记》
*mvlb
(' & t=W}SH 1 编程的要素
E92KP?i 编程有 3 个要素:语言、环境和思想。
mb^~qeRQ |imM#wF 1.1 语言
pJ'"j 6Q 有人喜欢争论语言的优劣。其实,除了汇编语言,各种语言、脚本、标准库、类库、框架都蕴含着大量成熟的编程经验和思想。程序员应该多熟悉一些语言,特别是有代表性的语言。
U>}w2bZ* ,M
^<CJ 个人觉得,一个程序员应该掌握一两种汇编语言( CISC 的 X86 、 RISC 的 ARM )、一种面向过程语言( C )、两、三种面向对象语言( C++ 、 Java 、 Delphi )、一两种脚本语言( perl 、 python 、 ruby )。如果有时间,可以再学习一些学术性较强的语言,例如 Scheme 。
@O^6&\s> dE{dZ#Jfi 学习新的语言,不仅可以吸收语言中蕴含的设计理念,还可以打开连接新空间的大门,使我们可以学习、复用使用该语言的各种资源,例如源代码、文章、书籍。
]Ntmy;Q K} X&AJ5A 1.2 环境
_TQj~W< 1.2.1 开发时和运行时
}l} Bo.C 环境可以被理解为程序所有外界环境的总和,包括开发时环境、运行时环境。我们在写一段程序时,应该对该程序的相关环境有清楚的了解。
t)$:0 Sw,+p 开发时环境包括我们使用的编译(链接)环境、复用的代码(框架、类库、控件等),系统的逻辑结构、代码的文件组织、需要的工具软件、调试环境等等。
30T)!y O.M>+~Nw 运行时环境包括程序运行时环境中所包含、发生的一切,特别是与我们的程序相关的部分。从小处看,我们应该知道如何确定每段代码运行的 context (线程和堆栈),每个变量所使用的空间的信息。从大处看,我们应该了解系统运行的来龙去脉,各个模块(逻辑概念)如何相互配合,各个线程(调度单位)如何相互通信,什么时候可能发生调度,系统中有哪些不确定的因素等等。
,uhb~N< EaY?aAuS: 1.2.2 软件类型
kzUIZ/+ZL, 比较 “ 典型 ” 的软件类型包括:
U$D65B4= N]=q|D 1. Windows 操作系统;
8\A#CQ5b Sp]0c[37R 2. Linux 操作系统;
eiaFaYe\ XW)lDiJl 3. 编译器;
hH8oyIC <
!C)x 4. 虚拟机;
C{xaENp 4*cEag 5. 调试器;
a![{M<Y~ IDriGZZ<)6 6. Windows 的单机应用程序;
/dI&o,sA (m(JK^ 7. Windows 的驱动程序;
b&N'C9/8 =ToyZm\ 8. Linux 的应用程序和驱动程序;
bUdLs.: M; tqp8 9. 基于 socket 的客户端 - 服务器程序;
:vQrOn18p :zke %Yx 10. 数据库应用程序;
5 ,B_u%bb 0{p#j~ZhC 11. 使用数据库的 Web 应用程序;
CXx*_@}MU A>;bHf@ 12. 使用 RTOS 的嵌入式软件;
'"/=f\)u !6O(-S2A 13. 不使用 RTOS 的单片机程序;
,pQZ@I\z dhf!o0'1M 14. DSP 程序;
u5b|#&-mX Y>dzR)~3[ 15. 嵌入式环境的第三方程序( J2ME 应用、 BREW 应用、 symbian 的应用程序等等);
Ma']?Rb` S3*`jF>q 16. 各种中大型程序的脚本环境,插件的开发、运行环境;
h-K_Lr] a;qryUyG 17. Office 应用程序开发;
=M[bnq*\ e>7>j@(K] 18. flash 编程;
jB Z&Ad@e Q}K"24`= 软件的种类实在太多,所谓 “ 典型 ” 只是我个人的理解,肯定还有很多软件类型没有被列出来。程序员应该了解开发和运行这些软件时,究竟发生了什么。
pis`$_kmwV 1N#|
}ad 对于 Windows 、 Linux 操作系统,我们应该有个概要的了解:从 BIOS 程序读 Master Boot Record ,到系统的装载运行;应用程序或动态连接库( Linux 的 SO )的装载;操作系统的基本模块(包括内核)的功能; Windows 如何通过 COM 机制将各个功能模块组合起来等等。这些内容是 PC 程序的基本运行环境。
}Gm>`cw- g-</ua(j 嵌入式环境相对 PC 环境要简单一些,特别是用 NOR flash ,代码直接从 ROM 运行的系统。一方面,程序员通常可以看到系统运行的所有代码;另一方面,嵌入式环境有时不提供第三方程序运行机制,有时提供比较简单的机制,有时用 java 虚拟机当作第三方程序运行机制。不过,智能手机的应用处理器一般使用 NAND flash ,从 BIOS 运行一小段启动代码,将系统装载到 RAM 运行,同时支持应用程序装载运行,已经很接近 PC 环境。
DIfaVo/" JWhdMU 编写单机应用程序,除了语言外,主要要熟悉各种库、框架、组件。一些通用库提供了常用函数、各种容器和算法、 GUI 、典型的程序框架,系统 API 的封装等等,例如:
:tB1D@Cb6 Val|n*% § 移植性比较好的 C 标准库、 STL 、 boost 、 TK 等;
6"5A%{J p\tm:QWD; § Windows 上的 MFC 、 VCL ( Delphi/C++ Builder );
kY|utoAP rIu$pZO § Linux 上的 ncurses 、 X Windows 、 GTK 、 Qt 等;
Ls$D$/:q? N06OvU2>xU § 访问数据库: VC++ 的 ODBC 、 DAO 、 ADO , Borland 的 BDE 等;
"R1NG?;q 0oZ=
yh § Borland 做了一些在源代码级跨平台的库: Delphi/Kylix 的 CLX 、 dbExpress ;
O1U= X:Zl oAJM]%g{ § CPAN 上的大量 perl 模块、 java 的类库等等;
):6 8%, M2>Vj/ 上面列出的是一些比较通用的库。还有用于各种语言的大量专用库,各种提供二进制接口的组件、控件。
Ml{Z
Fg5kX 编译器、虚拟机也是单机应用程序(在嵌入式环境,虚拟机可能是系统软件的一个模块)。不过它们的地位比较特殊。作为程序员,我们应该了解编译器、集成开发环境、软件框架、虚拟机、操作系统分别为我们做了什么。
0$)>D== *ebSq) 作为程序员,我们同样应该理解调试器也是一个应用程序,调试器的基本原理,它能做什么,有什么限制。如果调试器与目标程序运行在不同的 CPU 上,调试是如何实现的,有哪些不同的实现方式?例如 JTAG 调试利用了目标 CPU 的调试接口直接调试目标程序;串口调试要求将一段调试代码和目标程序链接在一起下到目标 CPU 中,由嵌入的调试代码与 PC 机的调试器通信实现调试。不同的实现手段决定了调试器的能力和限制。
HU8900k+ n,V[eW#m'L 目前最热门的软件类型就是使用数据库的 Web 应用了,例如各种网站、网络游戏、各种企业、行业、政府机构的管理系统,在这个领域集中了处于食物链不同环节的大量厂商,各种 Web 服务器、基础平台、应用开发框架。随便列一下,也能列出一堆名词:
p{Yv3dNl F^t DL: § HTML/CSS 和 CGI ;
wc NOLUl "fCu=@i § java applet 、 java script 、 ActiveX 控件;
p;59? y^,1a[U. § php 、 asp 、 jsp 、 servlet ;
R'bTN|Cq +\c5]` § .net 家族: asp.net 、 ado.net 等;
Sw8]EH6 r6MMCJ|G § J2EE with/without EJB 、 Spring 、 Struts 、 Hibernate ;
3G)#5Lf< kHghPn?8] § Ruby on Rails 、 Plone 等;
L_uVL#To NMa} {*sQ 在一种软件类型上,集中了这么多开发技术、框架、模式,也可以称得上蔚为壮观了。不过,这个领域里确实是各种最新的编程思想、方法、设计模式的演武厅,如同当年的编译器,值得所有程序员研究、学习。
:Ij{s o WrKM 1.3 思想
'EEJU/"u COM 可以被看作 OLE 发展的衍生品。但它的重要性远远超过了 OLE 。它首被独立出来,成为 OLE 、 ActiveX 的基础,然后逐步成为在 Windows 进行二进制集成的基础。 COM 和 RPC 的结合产生了 DCOM 。 DCOM 和 MTS 的结合产生了 COM+ 。虽然这些技术都是用于 Windows 平台的,但组件技术的基本思想是独立于具体环境的。也就是说,对程序员而言,存在着独立于语言和环境之外的领域,这就是编程的思想。
D9CaFu {W=%U|f 例如看看 Qualcomm 的 BREW ,就会发现它从 COM 中学习了多少东西。嵌入式平台的程序员使用 PC 平台的技术,这就是编程思想的价值。对于程序员来说,各种编程思想、设计模式,是最为宝贵的东西。这里所说的设计模式并不局限于 GOF 的《设计模式》,任何惯用的手法都可以被看作模式。
t7dt*D_YqK Pw7]r<Q 一些基本的编程思想起源于更普遍的智慧。例如:
u<6<iD3y J!v3i*j\ 心智的活动,除了尽力产生各种简单的认识之外,主要表现在以下三个方面: 1) 将若干简单认识组合成一个复合认识,由此产生出各种复杂的认识。 2) 将两个认识放在一起对照(在这样做时并不将它们合而为一),不管它们如何简单或者复杂,由此得到有关它们的相互关系的认识。 3) 将有关认识与那些在实际中和它们同在的所有其他认识隔离开,这就是抽象。所有具有普遍性的认识都是这样得到的。
['X]R:3h --- John Locke, 有关人类理解的随笔
F3v!AvA| x=hiQ>BIO0 程序员从这段 1690 年的文字中能看到什么。组合、对照、抽象,这些基本的思维工具同样也是程序员最基本的工具。
pMx*F@&nU ?Wr+Q 2 编程规则
b8`)y<