首页 > 代码库 > 微软资深软件工程师:阅读代码真的很难
微软资深软件工程师:阅读代码真的很难
编者按:原文作者EricLippert是一名资深软件设计工程师,从1996年起一直在微软开发部门任职,协助设计并实现VBScript、 JScript、JScript.NET、Windows Script Host、Visual Studio Tools for Office 和 C#。
Escalation的工程师JeremyK在他的博客中问到:
你是怎么教人们快速深入挖掘不熟悉的代码(不是自己所写的)?我学习如何编程的方法很传统 —— 自己动手编码。但我现在很纠结:到底是集中精神阅读源码,还是自己编写。对我而言,似乎唯一有效的方法就是自己写过。
不是和Jeremy开玩笑,写代码的确没有读代码难。
首先,我同意你的看法,几乎很少有人能读代码但不会写代码。这不像自然书面语或口语,理解他人的意思并不需要去理解他们为什么要那样说。比如,如果我说:
“写代码有两种方式:一种严格且详细,另一种模糊且草率。前者生成简洁分层的婚礼蛋糕,后者却是意大利面条。”
上面这句话产生一个平衡且幽默的效果,但即使听众和读者不理解我使用“零照应”和“并列句”这样的文字技巧,也会理解我要说的意思。但是说到代码,既要从代码本身中理解代码作者的意图,又要理解代码产生的预计效果,这两者都极为重要。
因此,我又回到那个问题了,有些人需要快速切入代码,但不需要动手写代码,那我们如何编写适合这些人的代码?
下面是我在编写代码时,尽力去做的事,目的就是使其他人能轻松阅读:
- 使代码遵从工具。Object Browsers和Intellisense虽然很好,但我告诉你,我是守旧派。如果找不到我想要的,我会不高兴。什么使得代码成为可查询的呢?
- 像"i"这样的变量名不好。如果没有明确的错误提示,你就无法轻易查找代码。
- 避免使用是其他名字前缀的名字。比如,在代码中有个“perfExecuteManifest”,如果再有一个“perfExecuteManifestInitialize”,这就会让我抓狂,因为每次在源码中查询前者时,我不得不费力地过滤掉后者所有的实例。
- “临时传递数据”(tramp data)应使用相同的名字。所谓“临时传递数据”(tramp data),就是指那些传递给方法A的变量,还要传给方法B的变量。这两类变量实际上是相同的,所以如果它们有着相同的名字,则更好。
- 别用宏来重命名东西。如果有个方法叫get_MousePosition,那别这样GETTER(MousePosition)来声明该方法。因为我会找不到实际的方法名。
- Shadowing会引起很多问题,请不要用它。
- 坚持使用一种命名模式。如果你打算用匈牙利命名法,那就坚持并广泛使用,否则将适得其反。使用匈牙利命名法来记录数据,而不是存储类型;记录普遍事实,而不是临时条件。
- 使用断言来记录先决条件(preconditions)和后置条件(postconditions)。
- 别缩写英文单词。确切来说,别缩写成稀奇古怪的形式。在脚本引擎中,有个变量名叫“NME”,这让我非常抓狂!它应当叫“VariableName”。
- C语言标准运行时库的设计不是很优秀。别去效仿它。
- 别写“聪明”的代码;当代码出现问题,维护代码的程序员没时间去理解你的聪慧。
- 理解编程语言特性的设计初衷,使用这些特性去做它们适合完成的工作,而不是它们能做到的工作。例如:别把异常当做一般的流控制机制来使用(即便你能做到),而应该用它们来报告错误。别强制把接口指针转换成类指针,即便你知道这样没问题。
- 按功能单元划分源码树,而不是按组织结构。比如:我目前所在团队中,有2个根子目录的名字是“Frameworks”和 “Integration”,这是两个团队的名字。不巧的是,Frameworks团队名下有一个叫“Adaptor”的子目录,而“Adaptor”却是Integration的子目录,这就非常令人迷惑。同理,(如果)有着相同子目录的不同的子树,有些是客户端的组件,有些是服务端的组件;有些是管理组件,有些是非管理组件;有些是处理型组件,有些是非处理型组件;有些是零售组件,有些内部测试工具。这就会乱七八糟的。
当然,我实际上根本没有回答Jeremy的问题——如何调试不是我写的代码?
这取决于我的目的。如果我只是因为一个bug,而深挖一段具体的代码,我会在调试器中逐步跟踪所有代码,写下我“走过”的调用分支,记录下哪些方法是特定数据结构的“生产者”,哪些方法是“消费者”;我也会仔细盯着输出窗口,查看出现的有用信息;还要打开异常捕捉器,因为异常通常是问题所在。设置断点;我会记录所有和我上面建议相反的地方,因为这些东西很可能误导了我。
如果我想在理解一段代码后修改它,我通常是从代码头部开始,或者先查找公共方法。我要知道类是如何实现的,它是如何扩展的,它的作用,它是如何嵌入整个代码中的?我会尽力理解这些东西后,才去了解这些特定部分(代码)是如何实现的。这耗时虽更长些,但如果你准备改动复杂代码,你应当那样做。
如何阅读代码?像某些人一样……
我已经记不清有多少次看到程序员(用鼠标)滚上滚下地看着不熟悉的代码,几分钟过后,他们的脸上浮现出不悦的表情。他们不久后会宣告说,那代码不值一读,为什么要浪费时间呢?我们只能用其他方法解决问题。我不确定(他们)在期待什么,是通过潜移默化来吸收代码的含义,还是集中精神盯着代码来得到启发?你不能只靠长时间盯着代码来阅读代码,你要理解它并化为己用。 这里有一些我喜欢用的技巧,虽然这不是一份详尽的列表,但我发现其中有些特别有用。
- 1. 尽力构建并运行代码。这通常是一个简单的步骤,就像你在看可运行的代码(这和随机代码相反)。不过,并非总是如此。通过构建和执行代码,你能从中学到很多上层代码结构。说到工作代码,你是否非常熟悉如何构建你的当前项目?虽然构建通常非常复杂,但通过构建并生成可执行的代码,你能学到很多。
- 2. 不要只注重细节。你要做的第一件事是,在你正阅读的代码中,找到代码结构和风格。首先浏览一下代码,尽力理解不同代码段要做什么。这会让你熟整个代码的上层结构,你也能领会到你正处理的代码的一些构思(良好架构和意大利面条等)。这时候,你可以找到切入点(不管它是什么,主函数、servlet 或控制器等),并查看代码如何在那里分支。不要在这上面花过多的时间,随着你愈加熟悉代码,你可以随时回来查看。
- 3. 确信自己理解所有结构。除非你碰巧是所用编程语言的首席专家,否则该语言有些它能做的事你可能还不知道。当你在浏览代码时,记下所有你或许不熟悉的结构。如果有很多不熟悉的结构,你要做的下一步非常明显。如果你不知道代码要做什么,那你就走不了很远。 即便只有几个你不熟悉的结构,你应当深入查看。你现在是在探索你所用编程语言中你以前不知道的东西,为此花几个小时来阅读代码,我也非常乐意。
- 4. 既然你对大多数结构已有很好了解,那现在是该做些随机深入研究了。 就像步骤2,开始浏览代码,当这次要挑选一些随机函数或类,并开始逐行详细查看。这是硬仗开始的地方,但也是你要取得主要成功的地方。这里的构想,会形成你正在查看的代码库的思维模式。也不要在这上面花过长的时间,但在继续前行之前,你要尽力并极大吸收一些有内容的代码块。这个步骤,你也可以随时反复回过头来,每次你都会了解更多的背景,并收获更多。
- 5. 毫无疑问,在前面这些步骤中,肯定有你困惑的地方,所以这是你做些测试的最佳时间。在测试的时候,你的麻烦可能会更少,同时你也能理解代码。 我一直感到奇怪,开发人员忽略一套写得很好很全面的测试代码,而尽力去阅读并理解某些代码。当然了,有时候并没有测试。
- 6. 如果你说没有测试,那这听起来是编写测试的时候了。 (编写测试)有很多益处,有助于你自己的理解,有助于你提升代码库,阅读代码时也能编写代码,这是该你出手做些事的时候。 即便已经有了测试,通常你也可以编写一些测试,你总能受益的。 测试代码通常需要换种方式思考问题,那些你以前不太明了的概念也会变得更清晰。
- 7. 提取奇特的代码,使其成为单独的程序。我发现阅读代码是个非常有趣的练习,即便只为节奏变化。即便你不了解代码的底层细节,你或许能知道一些代码在上层结构上要做什么。为什么不提取一些特定的函数,单独列为独立的程序。当你在执行小段程序时,调试也会更简单。反过来说,可能还需要一些额外的步骤,才能理解你正查看的代码。
- 8. 代码不干净?有异味? 为什么不重构它?我并不建议你重写整个代码库,但重构部分代码,真的有助于你的理解层次上升一层。 把你理解的函数拿出来,改成独立的函数。在你知道之前,原来的大函数看起来易管理,你可以在脑海中修改它。 重构允许你把代码变成自己的,无需完成重写代码。如果有好的测试,有助于重构,但即便你没有好的测试,抽取你确定的函数并做测试。即便测试看起来完全不充分,但作为一个开发人员,你得学着相信你的技能,有时候你只需努力去做(重构)。(如果你必须重构,你通常都可以把代码恢复原状。)
- 9. 如果没什么能帮上忙,那你就找个阅读代码的同伴。或许并非只有你一个人能从这代码中获益,所以去找一个人,一起阅读代码吧。 但你别找专家,他们会从上层结构上,向你解释所有东西,你会错失那些你自己详细查看代码时所能学到的细微差别。然而,如果不见效的话,你也不能理解,有时候,你能做的最好的事就是去问。向你的同事请教,如果你正在阅读开源代码,可以在互联网上找人问问。但是你要记住,这是最后一步,而不是第一步。
如果我时间紧迫,需要快速合理地理解某些代码,并且我只能挑选上述步骤的其中一个,那我会选择“重构”(即:第 8 个步骤)。虽然你能理解的东西不会很多,但那些你领会的东西,你会牢牢记住的。总之,有件事你需要记在心里。如果你新接触一个重要的代码库,你不可能立即能理解它。这需要数天、数周和数月的潜心努力,接受这个事实。即便有一位专家和你在一起,也不能明显地缩短时间。然而,当涉及到代码库时,如果你能耐心并有条不紊地阅读(和编写)代码,你最终能熟悉项目的方方面面,你能成为大牛。你或者是逃避阅读代码,经常寻求某人帮你讲解某事。我知道我会成为哪一种人。
寻找阅读代码的机遇 – 不要错失
我们喜欢编写新代码,是因为我们这次能正确处理问题。好吧,也许不是这次,但一定是下次。事实上是,你经常改进你的技术,但你从没有恰当地处理问题。这就是编写新代码的价值所在,你可以历练并磨练你的技能,但阅读和把玩其他人编写的代码,(如果没有更多的价值,)也是有同样多的价值。你不仅能从中获得一些有价值的技术知识,也能收获领域知识,领域知识通常仍具更多价值(毕竟,代码是文档的最终形式)。
即便代码写得很神秘,无任何惯例可言,但还是有价值。你知道我在说的代码,它几乎看起来晦涩难懂,但不是有意而为之(因某些原因,Perl 语言代码通常是这样的)。不管什么时候我看到那样的代码,我都会这样想: 把它想象成只有你破译它后才能学到的东西。是的,这是主要的痛楚之处,但要接受它,有时候你自己也会因琐碎的原因而写出那种使人困惑的代码(否认没有用,你知道这是真的)。好了,如果你花些时间来阅读那样的代码,你更有可能最终写出同样的代码。并不说你将会写出那样的代码,但你有能力写出那样的代码。最后,态度通常是最重要的(编注:态度决定一切)。如果你视阅读代码为日常繁琐的工作,那它就是(繁琐的工作),并且你会逃避,但如果你视其为一个机遇,那好事终将到来。
注:本文转载自http://blog.csdn.net/sdulibh/article/details/38412955
微软资深软件工程师:阅读代码真的很难