首页 > 代码库 > 从List[Future[T]]到Future[List[T]]

从List[Future[T]]到Future[List[T]]

在课程<Principles Of Reactive Programming>里Week3的一节 "Promises, promises, promises"中,Erik Meijer举了一个例子,实现一个函数:

def sequence[T](fs: List[Future[T]]): Future[List[T]] = {.....}

这个函数实际在Scala library的Future对象中有标准的实现。

def  sequence[A, M[X] <: TraversableOnce[X]](in: M[Future[A]])(implicit cbf: CanBuildFrom[M[Future[A]], A, M[A]], executor: ExecutionContext): Future[M[A]]

 

Simple version of Future.traverse. Transforms a TraversableOnce[Future[A]] into a Future[TraversableOnce[A]]. Useful for reducing many Futures into a single Future.

俺就想试着自己实现一下,于是写出了下面这段有问题的代码……

object ConcurrentTool {  def collect[T](futures: List[Future[T]]): Future[List[T]] = {    val p = Promise[List[T]]    var list = List.empty[T]    futures.foldLeft(list) {      (curr, future) => {        if (p.isCompleted)          curr        else {          future.onComplete {            case Failure(e) => p.failure(e)            case Success(e) => list = e :: list          }          list        }      }    }    if (!p.isCompleted)      p.success(list)    p.future  }def main(args: Array[String]) = {    def futureOne = {      Future {        1      }    }    def futureTwo = {      Future {        2      }    }    val collection = collect(List(futureOne, futureTwo))    val lists = Await.result(collection, 1 seconds)    println(lists.size)  }}

collect方法用于将一个List[Future[T]]变成一个Future[List[T]]。然后我传给它两个future,等返回的Future[List[T]] compelete,然后取结果List的大小,打印出来。

但是结果是0……但是,在我加了断点进行调试时,有时结果是2,为啥呢? 错误不可怕,这是纠正自己的机会。

再来看一下collect方法的实现吧。我用一个Promise生成最后的future, 用一个空List做为foldLeft的初始值,然后遍历List[Future]里的所有future。对于每个future,给它注册一个回调函数,当它fail的时候,用引起fail的异常去complete跟最后结果相关的那个Promise,如果这个future成功了,就把它的结果附加在list里。在注册完回调之后,我返回保存结果的list。

问题就在这些操作的执行时间上。给future注册回调函数的动作是在main线程中,这个注册不会阻塞main线程的执行,假如被注册的函数的确是在另一个线程中执行的,那么在注册完回调函数之后,我返回的list仍然可能是最初的那个empty list, 所以在foldLeft完成后,foldLeft返回的仍然可能是那个empty list。接下来,我判断p.isCompleted, 如果否,我就用这个list去complete这个Promise,实际上我用一个empty list去complete了它,所以在获取collection的结果后,发现这个是一个空列表。

那么我们想要的结果如何实现呢?关键是,必须得生成这个Future[List]的所有future都compelete时,这个Future[List]才能complete。如何实现这一点呢?

  • 我们可以阻塞执行collect方法的线程,显式地等待List[Future]里的所有future完成,再complete跟结果相关的那个Promise。但是这样做,会阻塞调用collect的线程,也违背了我们返回一个Future的目的。
  • 我们可以在另一个线程里等待List[Future]里的所有future完成,再complete跟结果相关的那个Promise。在collect方法中,返回Promise对应的future。这样就不会阻塞调用collect的线程。

如何在另一个线程等待呢?可以用Await来阻塞等待,或者注册callback,使得当所有future完成时,callback被调用。

假如有两个Future,可以用下边的代码注册callback。

 def waitBoth[T](futureA: Future[T], futureB: Future[T]): Future[List[T]] = {    val p = Promise[List[T]]()    futureA.onComplete{      case Failure(e) => p.failure(e)      case Success(t) => futureB.onComplete{        case Failure(eb) => p.failure(eb)        case Success(b) => p.success(t :: b :: Nil)      }    }    p.future  }

这个变形一下,用flatMap和map表示就是

 def waitBoth[T](futureA: Future[T], futureB: Future[T]): Future[List[T]] = {    val p = Promise[List[T]]()    futureA.onComplete{      case Failure(e) => p.failure(e)      case Success(t) => futureA.flatMap{a: T =>        futureB map {b =>          p.success(a :: b :: Nil)        }      }    }    p.future  }

实际上Future的map和flatMap在实现时也用了Promise, 上边的代码简化一下就是

  def waitBoth[T](futureA: Future[T], futureB: Future[T]): Future[List[T]] = {    futureA.flatMap { a: T =>      futureB map { b =>        a :: b :: Nil      }    }  }

再把flatMap和map转成for循环表示,就是

  def waitTwo[T](futureA: Future[T], futureB: Future[T]): Future[List[T]] = {    for {      a <- futureA      b <- futureB    } yield a :: b :: Nil  }

那么如何组合更多的Future呢?我们来写一个方法把一个Future[T]的结果附加到Future[List[T]]中

  def waitMore[T](futureA: Future[T], futures: Future[List[T]]): Future[List[T]] = {    for{      a <- futureA      b <- futures    }yield a :: b  }

然后以此为基础,就可以构造最早提到的sequence函数

  def waitSome[T](futures: List[Future[T]]): Future[List[T]] = {    val p = Promise[List[T]]()    p.success(Nil)    val init: Future[List[T]] = p.future    futures.foldLeft(init){      (curr, f) => waitMore(f, curr)    }  }

 上边代码关键在于了解到我们需要一个Future作为foldLeft的初始值,它必须是success的,且使其success的值为Nil。这个init实际上也可以用 val init: Future[List[T]] = Future{Nil}来得到。

这种形式距离<Principles Of Reactive Programming>给出的答案已经很接近了。实际上Erik Meijer给出了两个解法,其中跟这个相近的是

  def sequence[T](fs: List[Future[T]]): Future[List[T]] = {    val successful = Promise[List[T]]    successful.success(Nil)    fs.foldRight(successful.future){      (f, acc) => for{x <-f; xs <- acc} yield x :: xs    }  }

 

从List[Future[T]]到Future[List[T]]