首页 > 代码库 > 从Racket入门函数式编程

从Racket入门函数式编程

一直想学学LISP,今天总算开了个头。现在学习LISP不是为了马上能够用于实际项目的应用,而是为了学习一下函数式的思维方式,能够更加深入的了解计算的本质,能够更好的用C++, Java, Python等编写程序。更何况,这些主流语言都逐渐增加了函数式编程的特征,C++,Java现在都引入了 Lambda 表达式。如果能够系统学习一下LISP,相信对自己以后掌握这些语言的新特新特征,对自己写JavaScript、Python,对自己了解闭包、高阶函数、Lambda表达式都会有很大帮助。言归正传,首先推荐三个资源:

  • Racket官方网站
  • How to Design Programs
  • 如何设计程序( How to Design Programs 中文版) 

Racket 的诞生与发展

简单介绍一下Racket的发展,详见知乎的一个关于Racket的问题回答:
1958年,人工智能之父John McCarthy 发明了一种以 Lambda 演算为基础的符号处理语言,1960年 McCarthy 发表著名论文 Recursive Functions of Symbolic Expressions and Their Computation by Machine, 从此这种语言被命名为 LSIP (List Processor),其语法被命名为:符号表达式(S-Expression)。LISP构建在7个函数 [atom car cdr cond cons eq quote] 和2个特型 [lambda label] 之上


Lisp诞生之初是为了纯粹的科学研究,代码执行像数学公式一样,以人的大脑来演算。直到麦卡锡的学生斯蒂芬·罗素将eval函数在IBM 704机器上实现后,才开启了Lisp作为一种计算机语言的历史。1962年,第一个完整的Lisp编译器在MIT诞生,从此之后Lisp以MIT为中心向全世界传播。之后十多年,出现了各种Lisp方言。


1975年,Scheme诞生。Scheme同样诞生与MIT,它的设计哲学是最小极简主义,它只提供必须的少数几个原语,所有其他的实用功能都由库来实现。在极简主义的设计思想下,Scheme趋于极致的优雅,并作为计算机教学语言在教育界广泛使用。


1984年,Common Lisp诞生。在二十世纪七八十年代,由于Lisp方言过多,社区分裂,不利于lisp整体的发展。从1981年开始,在一个Lisp黑客组织的运作下,经过三年的努力整合后,于1984年推出了Common Lisp。由于Scheme的设计理念和其他Lisp版本不同,所以尽管Common Lisp借鉴了Scheme的一些特点,但没有把Scheme整合进来。此后Lisp仅剩下两支方言: Common Lisp 和 Scheme。


从二十世纪九十年代开始,由于C++、Java、C#的兴起,Lisp逐渐没落。直到2005年后,随着科学计算的升温,动态语言JavaScript、Python、Ruby的流行,Lisp又渐渐的回到人们的视线。不过在Lisp的传统阵地教育界,Python作为强有力的挑战者对Scheme发起冲锋;在2008年,MIT放弃了使用Scheme作为教学语言的SICP(计算机程序的构造和解释)课程,而启用Python进行基础教学。同时美国东北大学另立炉灶,其主导的科学计算系统PLT Scheme开始迅猛发展;2010年,PLT Scheme改名为Racket。近几年,The Racket Language连续成为年度最活跃语言网站,并驾齐驱的还有haskell网站。


符号表达式 S-Expression

首先说一下S表达式:S-表达式的基本元素是list与atom。list由括号包围,可包涵任何数量的由空格所分隔的元素,原子是其它内容。其使用前缀表示法,在Lisp中既用作代码,也用作数据。如:1+2*3  写成前缀表达式就是 (+ 1 (* 2 3)) 。

  • 优点:容易parse,简单纯粹,不用考虑什么优先级等,也是实现代码即数据的前提;
  • 缺点:可读性不是很强;

高阶函数

高阶函数至少满足下列一个条件:

  1. 接受一个或多个函数作为输入; 
  2. 输出一个函数;

微积分中的导数就是一个例子,映射一个函数到另一个函数。在无类型 lambda 演算中,所有函数都是高阶的。在函数式编程中,返回另一个函数的高阶函数被称为Curry化的函数。Curry化即把接受多个参数的函数变换成接受一个单一参数(最初函数的第一个参数)的函数,并且返回接受余下的参数而且返回结果的新函数的技术。如 f(x,y)=x+y, 如果给定了 y=1,则就得到了 g(x)=x+1 这个函数。


Lambda 表达式

Racket中实用Lambda表达式来定义匿名函数,《如何设计程序》书中给出的使用原则是:如果某个非递归函数只需要当参数使用一次,使用Lambda表达式。如果想用Lambda表达式来表达递归,就需要引入Y组合子,Y 就是这样一个操作符,它作用于任何一个 (接受一个函数作为参数的) 函数 F,就会返回一个函数 X。再把 F 作用于这个函数 X,还是得到 X。所以 X 被叫做 F 的不动点(fixed point),即 (Y F) = (F (Y F)) 。


惰性求值

惰性求值(Lazy Evaluation),说白了就是某些中间结果不需要被求出来,求出来反而不利于后面的计算也浪费了时间。参见:惰性求值与惰性编程。
惰性求值是一个计算机编程中的一个概念,它的目的是要最小化计算机要做的工作。惰性计算的最重要的好处是它可以构造一个无限的数据类型。使用惰性求值的时候,表达式不在它被绑定到变量之后就立即求值,而是在该值被取用的时候求值。语句如 x:=expression; (把一个表达式的结果赋值给一个变量)明显的调用这个表达式并把计算并把结果放置到 x 中,但是先不管实际在 x 中的是什么,直到通过后面的表达式中到 x 的引用而有了对它的值的需求的时候,而后面表达式自身的求值也可以被延迟,最终为了生成让外界看到的某个符号而计算这个快速增长的依赖树。


闭包

闭包在计算机科学中,闭包(Closure)是词法闭包(Lexical Closure)的简称,是引用了自由变量的函数。自由变量是在表达式中用于表示一个位置或一些位置的符号,比如 f(x,y) 对 x 求偏导时,y就是自由变量。这个被引用的自由变量将和这个函数一同存在,即使已经离开了创造它的环境也不例外。在函数中(嵌套)定义另一个函数时,如果内部的函数引用了外部的函数的变量,则可能产生闭包。运行时,一旦外部的 函数被执行,一个闭包就形成了,闭包中包含了内部函数的代码,以及所需外部函数中的变量的引用。其中所引用的变量称作上值(upvalue)。网上有很多讲 JavaScript 闭包的文章,如果你对 LISP 有系统的了解,那么这个概念自然会很清楚了。


快排的Racket实现

#lang racket
(define (quick-sort array)
  (cond
    [(empty? array) empty]                                                    ; 快排的思想是分治+递归
    [else (append 
           (quick-sort (filter (lambda (x) (< x (first array))) array))       ; 这里的 array 就是闭包   
           (filter (lambda (x) (= x (first array))) array)
           (quick-sort (filter (lambda (x) (> x (first array))) array)))]))

(quick-sort ‘(1 3 2 5 3 4 5 0 9 82 4))
;; 运行结果 ‘(0 1 2 3 3 4 4 5 5 9 82)

通过这个例子,就可以感受到基于 lambda 算子的  Racket  语言强大的表达能力了。高阶函数、lambda 表达式和闭包的使用使得 Racket 所描述的快排十分的精炼,这和基于冯诺依曼模型C语言是迥然不容的思维模式。后面,随着Racket 学习的进一步深入,尝试写一下解释器。