首页 > 代码库 > 函数与闭包

函数与闭包

scala中函数4种的表现形式{

  对象中的函数,

  内嵌在函数的函数,

  函数字面量,

  函数值

1)对象中的函数

  不解释。

2)内嵌在函数中函数

  控制helper函数的方式 一般限制访问级别private。scala可以通过内嵌方式控制(前者同样生效),类似方法中的变量(本地变量)。

  本地函数可以访问外层的函数参数等。scala的嵌套和作用域思想是什么???为何嵌套和作用域的思想对于函数是一等公民的语言中及其重要???

3)一等函数:函数字面量与函数值

  什么是函数字面量?基本类型绝大部分都可以通过字面量来表示,比如 4,12 表示一个int值 2.3 表示double值等,函数也可以通过这种字面量来表示一个值(函数值)。而def形式是在定义一个函数,并不是一个值。再例如 val a:Int = 3定义Int类型的a,5是Int类型的值。

  一等函数,不仅可以通过定义和调用使用它们,还可以写成函数字面量,当作值来传递。

  函数字面量被编译进类,并在运行时形成对象(及函数值)。

  函数字面量和函数值的区别:源码与运行时。如同蓝图与建筑,类与对象。(这里函数字面量就是类,函数值就是对象

  函数值既是对象又是函数

val increase = (x: Int) => x + 1  //像对象一样传值给变量
increase(10)    //像函数一样调用参数

   函数字面量中的方法部分可以用{}

val increase = (x: Int) => {
    val y = x + 1
    y +1
}

   既然函数作为值,就可以传递给函数,形成高阶函数。

  栗子:集合类中的两个方法foreach与filter同是以函数作为参数的函数。

 

 

目标类型化 缩减函数字面量的无用字符??

占位符 _ 一个占位符只能表示一个函数参数,且这个函数参数在函数体中只能被用到一次

  栗子:(x:Int) => x+1    写成  _ + 1 

     (x:Int,y:Int) => x+y   写成  (_:Int) + (_:Int) 不简洁,但是如果是某一函数调用两个参数的函数时,可以通过类型推断(?)直接写成xx.yy(_ + _) 

 

部分应用函数

1.通过部分应用函数将def转换为函数值

def sum(a:Int,b:Int,c:Int) = a+b+c
val temp_sum = sum _

2.当指定了一些函数参数时候 部分应用函数的占位符还需要添加类型

scala> val mysum = sum(1,_,_)
<console>:11: error: missing parameter type for expanded function ((x$1, x$2) => sum(1, x$1, x$2))
       val mysum = sum(1,_,_)
                         ^
<console>:11: error: missing parameter type for expanded function ((x$1: <error>, x$2) => sum(1, x$1, x$2))
       val mysum = sum(1,_,_)
                           ^

scala> val mysum = sum(1,_:Int,_:Int)
mysum: (Int, Int) => Int = <function2>

 3. 1和2的原理是编译器将函数编译成类,mysum(2,3)其实在调用mysum.apply(2,3)。 apply方法?

 

闭包

自由变量与绑定变量 

闭包是函数值。通过自由变量创建的函数值称为闭包。

闭包捕获自由变量而不是变量所指向的值。所以变量的改变会影响闭包,同样闭包的也能改变自由变量。

scala> var s = 10
s: Int = 10

scala> val mydef = (a:Int) => a + s
mydef: Int => Int = <function1>

scala> mydef(1)
res0: Int = 11

scala> s = 12
s: Int = 12

scala> mydef(1)
res1: Int = 13

 

scala> val sumList = List(1,2,-1,-2,4)
sumList: List[Int] = List(1, 2, -1, -2, 4)

scala> var sum  = 0
sum: Int = 0

scala> sumList.foreach(sum += _)

scala> sum
res3: Int = 4

 

个人理解 当闭包的自由变量是函数参数时。每一次函数传参都会形成新的闭包。由于函数参数是val 所以函数体内形成的闭包的自由变量恒定。

 

重复参数

定义重复参数只要在类型后面加*

scala> def sum(a:Int*) = a.sum
sum: (a: Int*)Int

scala> sum(1)
res4: Int = 1

scala> sum(1,3,4)
res5: Int = 8

形成的类型其实是数组。所以可以调用数组sum方法。

然而不能传数组给sum函数,需要将数组转为arr: _*形式(这种形式是告诉编译器把数组中的每一个参数传给函数)

scala> val arr = Array(1,2,3,4,5,6,7,8,9)
arr: Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9)

scala> sum(arr)
<console>:13: error: type mismatch;
 found   : Array[Int]
 required: Int
       sum(arr)
           ^

scala> sum(arr: _*)
res7: Int = 45

 

指定名字的调用参数

scala> def speed(distance: Float, time: Float): Float = distance / time
speed: (distance: Float, time: Float)Float
scala> speed(100, 10) res9: Float = 10.0 scala> speed(distance=100,time=10) res10: Float = 10.0 scala> speed(time=10,distance=100) res11: Float = 10.0

 一般常用方式是默认顺序+指定参数 配合使用 (没记错的话,Spark中比较常见)

 

默认的参数值

scala> def printTime(out:java.io.PrintStream = Console.out) = out.println("time = " + System.currentTimeMillis())
printTime: (out: java.io.PrintStream)Unit

scala> printTime()
time = 1478591319201

scala> printTime(Console.err)
time = 1478591327893

 然而默认的参数值常常与指定参数配合使用 

scala> def printTime2(out: java.io.PrintStream = Console.out, divisor: Int = 1) = out.println("time = " + System.currentTimeMillis()/divisor)
printTime2: (out: java.io.PrintStream, divisor: Int)Unit

scala> printTime2(out = Console.err)
time = 1478591428641

scala> printTime2(divisor = 1000)
time = 1478591435

 

 

 

 

 

尾递归:scala编译器对尾递归进行了特殊处理,使得与指令形式的while效率相当。但由于JVM的限制使得尾递归并不能完全支持(间接尾递归,函数值的尾递归),支持直接尾递归。

 

函数与闭包