「这是我参与11月更文挑战的第3天,活动详情查看:2021最后一次更文挑战」。
并行流背后使用的基础架构是Java 7中引入的分支/合并框架。我们会在本文仔细研究分支/合并框架。
分支/合并框架的目的是以递归方式将可以并行的任务拆分成更小的任务,然后将每个子任务的结果合并起来生成整体结果。它是 ExecutorService 接口的一个实现,它把子任务分配给线程池(称为 ForkJoinPool )中的工作线程。
一、RecursiveTask
要把任务提交到这个池,必须创建 RecursiveTask 的一个子类,其中 R 是并行化任务(以及所有子任务)产生的结果类型,或者如果任务不返回结果,则是 RecursiveAction 类型。
要定义 RecursiveTask, 只需实现它唯一的抽象方法compute :
1 | java复制代码protected abstract R compute(); |
在我们实现这个方法时,需要同时定义将任务拆分成子任务的逻辑,以及无法再拆分或不方便再拆分时,生成
单个子任务结果的逻辑。
这个方法的实现类似于下面的伪代码:
1 | java复制代码if (任务足够小或不可分) { |
递归任务拆分过程如下所示:
分支/合并框架实例:为一个数字范围Long[]求和
1 | java复制代码import java.util.concurrent.ForkJoinPool; |
输出结果:
1 | bash复制代码ForkJoin sum done in: 64 msecs |
这个性能看起来比用并行流的版本要差,但这只是因为必须先要把整个数字流都放进一个long[] ,之后才能在任务中使用它。
二、Fork/join的最佳用法
虽然分支/合并框架还算简单易用,不幸的是它也很容易被误用。以下是几个有效使用它的最佳做法:
1)对一个任务调用 join 方法会阻塞调用方,直到该任务做出结果。因此,有必要在两个子任务的计算都开始之后再调用它。否则,你得到的版本会比原始的顺序算法更慢更复杂,因为每个子任务都必须等待另一个子任务完成才能启动。
2)不应该在 RecursiveTask 内部使用 ForkJoinPool 的 invoke 方法。相反,你应该始终直接调用 compute 或 fork 方法,只有顺序代码才应该用 invoke 来启动并行计算。
3) 对子任务调用 fork 方法可以把它排进 ForkJoinPool 。同时对左边和右边的子任务调用fork()似乎很自然,但这样做的效率要比直接对其中一个调用 compute 低。调用compute你可以为其中一个子任务重用同一线程,从而避免在线程池中多分配一个任务造成的开销。
4)调试分支/合并框架的并行计算代码可能有点棘手。特别是你平常都在你喜欢的IDE里面看栈跟踪(stack trace)来找问题,但放在分支/合并计算上就不行了,因为调用 compute的线程并不是概念上的调用方,后者是调用 fork 的那个。
5)和并行流一样,你不应理所当然地认为在多核处理器上使用分支/合并框架就比顺序计算快。一个任务可以分解成多个独立的子任务,才能让性能在并行化时有所提升。所有这些子任务的运行时间都应该比分出新任务所花的时长。
三、工作窃取
工作窃取为何被提出?
如前面的例子,我们指定数组的大小是10000L,即允许任务被拆分为每个数组大小为10000,共1000个任务。
在理想的情况下,每个任务完成的时间应该是相同的,这样在多核cpu的前提下,我们能保证每个核处理的时间都是相同的。
实际情况中,每个子任务花费的时间可以说是天差地别,磁盘,网络,或等等很多的因素导致。
Fork/Join框架为了解决这个提出,提出了工作窃取(work stealing)的概念。
在实际应用中,这意味着这些任务差不多被平均分配到 ForkJoinPool 中的所有线程上。每个线程都为分配给它的任务保存一个双向链式队列,每完成一个任务,就会从队列头上取出下一个任务开始执行。
基于前面所述的原因,某个线程可能早早完成了分配给它的所有任务,也就是它的队列已经空了,而其他的线程还很忙。这时,这个线程并没有闲下来,而是随机选了一个别的线程,从队列的尾巴上“偷走”一个任务。这个过程一直继续下去,直到所有的任务都执行完毕,所有的队列都清空。这就是为什么要划成许多小任务而不是少数几个大任务,这有助于更好地在工作线程之间平衡负载。
一般来说,这种工作窃取算法用于在池中的工作线程之间重新分配和平衡任务。如下图展示了这个过程。当工作线程队列中有一个任务被分成两个子任务时,一个子任务就被闲置的工作线程“偷走”了。如前所述,这个过程可以不断递归,直到规定子任务应顺序执行的条件为真。
四、Spliterator
那么Stream是如何实现并行的呢?我们并不需要手动去实现Fork/join,这就意味着,肯定有一种自动机制来为你拆分流。这种新的自动机制称为 Spliterator。
Spliterator 是Java 8中加入的另一个新接口;这个名字代表“可分迭代器”(splitableiterator)。和 Iterator 一样, Spliterator 也用于遍历数据源中的元素,但它是为了并行执行而设计的。
1 | java复制代码public interface Spliterator<T> { |
4.1 拆分过程
将 Stream 拆分成多个部分的算法是一个递归过程,这个框架不断对 Spliterator 调用 trySplit直到它返回 null ,表明它处理的数据结构不能再分割,流程如下描述。
1)第一步是对第一个Spliterator 调用 trySplit ,生成第二个 Spliterator 。
2)第二步对这两个 Spliterator 调用trysplit ,这样总共就有了四个 Spliterator 。
3)第三步,对当前所有的Spliterator 调用trysplit ,当所有的trysplit 都返回null,则表示拆分结束。
4.2 Spliterator特性
Spliterator的拆分过程也收到其本身的特性所影响,特性是通过characteristics()方法来声明的。
Spliterator 接口声明的最后一个抽象方法是 characteristics ,它将返回一个 int ,代表 Spliterator 本身特性集的编码。
有如下特性:
1 | arduino复制代码 /** |
这里做个简单了解就好了,限于篇幅暂时不深入了。
同学们看到这,觉得有学到一丁点知识的给个赞吧~
本文转载自: 掘金