「本文已参与好文召集令活动,点击查看:后端、大前端双赛道投稿,2万元奖池等你挑战!」
概念
Stream
将要处理的元素集合看作一种流,在流的过程中,借助Stream API
对流中的元素进行操作,比如:筛选、排序、聚合等。
Stream
的操作符大体上分为两种:中间操作符
和终止操作符
中间操作符
对于数据流来说,中间操作符在执行制定处理程序后,数据流依然可以传递给下一级的操作符。
中间操作符包含8种(排除了parallel,sequential,这两个操作并不涉及到对数据流的加工操作):
- map(mapToInt,mapToLong,mapToDouble) 转换操作符,把比如A->B,这里默认提供了转int,long,double的操作符。
- flatmap(flatmapToInt,flatmapToLong,flatmapToDouble) 拍平操作比如把 int[]{2,3,4} 拍平 变成 2,3,4 也就是从原来的一个数据变成了3个数据,这里默认提供了拍平成int,long,double的操作符。
- limit 限流操作,比如数据流中有10个 我只要出前3个就可以使用。
- distint 去重操作,对重复元素去重,底层使用了equals方法。
- filter 过滤操作,把不想要的数据过滤。
- peek 挑出操作,如果想对数据进行某些操作,如:读取、编辑修改等。
- skip 跳过操作,跳过某些元素。
- sorted(unordered) 排序操作,对元素排序,前提是实现Comparable接口,当然也可以自定义比较器。
终止操作符
数据经过中间加工操作,就轮到终止操作符上场了;
终止操作符就是用来对数据进行收集或者消费的,数据到了终止操作这里就不会向下流动了,终止操作符只能使用一次。
- collect 收集操作,将所有数据收集起来,这个操作非常重要,官方的提供的Collectors 提供了非常多收集器,可以说Stream 的核心在于Collectors。
- count 统计操作,统计最终的数据个数。
- findFirst、findAny 查找操作,查找第一个、查找任何一个 返回的类型为Optional。
- noneMatch、allMatch、anyMatch 匹配操作,数据流中是否存在符合条件的元素 返回值为bool 值。
- min、max 最值操作,需要自定义比较器,返回数据流中最大最小的值。
- reduce 规约操作,将整个数据流的值规约为一个值,count、min、max底层就是使用reduce。
- forEach、forEachOrdered 遍历操作,这里就是对最终的数据进行消费了。
- toArray 数组操作,将数据流的元素转换成数组。
Stream的创建
1、通过 java.util.Collection.stream()
方法用集合创建流
1 | java复制代码List<String> list = Arrays.asList("a", "b", "c"); |
2、使用java.util.Arrays.stream(T[] array)
方法用数组创建流
1 | java复制代码int[] array={1,3,5,6,8}; |
3、使用Stream
的静态方法:of()、iterate()、generate()
1 | java复制代码Stream<Integer> stream = Stream.of(1, 2, 3, 4, 5, 6); |
输出结果:
1 | vbnet复制代码3 |
stream
和parallelStream
的简单区分:
stream
是顺序流,由主线程按顺序对流执行操作;parallelStream
是并行流,内部以多线程并行执行的方式对流进行操作,但前提是流中的数据处理没有顺序要求。
例如筛选集合中的奇数,两者的处理不同之处:
Stream使用
遍历/匹配(foreach/find/match)
Stream
也是支持类似集合的遍历和匹配元素的,只是Stream
中的元素是以Optional
类型存在的。Stream
的遍历、匹配非常简单。
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码7 |
筛选(filter)
筛选,是按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中的操作。
筛选出Integer
集合中大于7的元素,并打印出来
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码8 |
聚合(max/min/count)
max
、min
、count
这些字眼你一定不陌生,没错,在mysql中我们常用它们进行数据统计。Java stream中也引入了这些概念和用法,极大地方便了我们对集合、数组的数据统计工作。
案例一:获取String
集合中最长的元素。
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码最长的字符串:weoujgsd |
案例二:获取Integer
集合中的最大值。
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码自然排序的最大值:11 |
案例三:计算Integer
集合中大于6的元素的个数。
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码list中大于6的元素个数:4 |
映射(map/flatMap)
映射,可以将一个流的元素按照一定的映射规则映射到另一个流中。分为map
和flatMap
:
map
:接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。flatMap
:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
案例一:英文字符串数组的元素全部改为大写。整数数组每个元素+3。
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码每个元素大写:[ABCD, BCDD, DEFDE, FTR] |
案例二:将两个字符数组合并成一个新的字符数组。
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码处理前的集合:[m,k,l,a, 1,3,5,7] |
归约(reduce)
归约,也称缩减,顾名思义,是把一个流缩减成一个值,能实现对集合求和、求乘积和求最值操作。
案例一:求Integer
集合的元素之和、乘积和最大值。
1 | java复制代码public class StreamTest { |
输出结果:
1 | vbnet复制代码list求和:29,29,29 |
归集(toList/toSet/toMap)
因为流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。toList
、toSet
和toMap
比较常用,另外还有toCollection
、toConcurrentMap
等复杂一些的用法。
下面用一个案例演示toList
、toSet
和toMap
:
1 | java复制代码public class Person { |
1 | java复制代码public class StreamTest { |
输出结果:
1 | ini复制代码toList:[6, 4, 6, 6, 20] |
统计(count/averaging)
Collectors
提供了一系列用于数据统计的静态方法:
- 计数:
count
- 平均值:
averagingInt
、averagingLong
、averagingDouble
- 最值:
maxBy
、minBy
- 求和:
summingInt
、summingLong
、summingDouble
- 统计以上所有:
summarizingInt
、summarizingLong
、summarizingDouble
案例:统计员工人数、平均工资、工资总额、最高工资。
1 | java复制代码public class StreamTest { |
输出结果:
1 | python复制代码员工总数:3 |
分组(partitioningBy/groupingBy)
- 分区:将
stream
按条件分为两个Map
,比如员工按薪资是否高于8000分为两部分。 - 分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组。
案例:将员工按薪资是否高于8000分为两部分;将员工按性别和地区分组
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码员工按薪资是否大于8000分组情况:{false=[Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='New York'}], true=[Person{name='Tom', salary=8900, age=23, sex='male', area='Washington'}, Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}]} |
接合(joining)
joining
可以将stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码所有员工的姓名:Tom,Jack,Lily |
排序(sorted)
sorted
,中间操作。有两种排序:
sorted()
:自然排序,流中元素需实现Comparable
接口sorted(Comparator com)
:Comparator
排序器自定义排序
案例:将员工按工资由高到低(工资一样则按年龄由大到小)排序
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码按工资升序排序:[Lily, Tom, Sherry, Jack, Alisa] |
提取/组合
流也可以进行合并、去重、限制、跳过等操作。
1 | java复制代码public class StreamTest { |
输出结果:
1 | css复制代码流合并:[a, b, c, d, e, f, g] |
分页操作
stream api 的强大之处还不仅仅是对集合进行各种组合操作,还支持分页操作。
例如,将如下的数组从小到大进行排序,排序完成之后,从第1行开始,查询10条数据出来,操作如下:
1 | java复制代码//需要查询的数据 |
输出结果:
1 | csharp复制代码[2, 2, 3, 3, 3, 5, 6, 7, 10, 20] |
并行操作
所谓并行,指的是多个任务在同一时间点发生,并由不同的cpu进行处理,不互相抢占资源;而并发,指的是多个任务在同一时间点内同时发生了,但由同一个cpu进行处理,互相抢占资源。
stream api 的并行操作和串行操作,只有一个方法区别,其他都一样,例如下面我们使用parallelStream来输出空字符串的数量:
1 | java复制代码List<String> strings = Arrays.asList("abc", "", "bc", "efg", "abcd", "", "jkl"); |
在实际使用的时候,并行操作
不一定比串行操作
快!对于简单操作,数量非常大,同时服务器是多核的话,建议使用Stream并行!反之,采用串行操作更可靠!
集合转Map操作
在实际的开发过程中,还有一个使用最频繁的操作就是,将集合元素中某个主键字段作为key,元素作为value,来实现集合转map的需求,这种需求在数据组装方面使用的非常多。
1 | java复制代码public static void main(String[] args) { |
输出结果:
1 | ini复制代码{40=Person{name='Lucy', salary=9000, age=40, sex='male', area='上海'}, 25=Person{name='Tom', salary=7000, age=25, sex='male', area='安徽'}, 30=Person{name='Jack', salary=8000, age=30, sex='female', area='北京'}} |
打开Collectors.toMap
方法源码,一起来看看。
1 | java复制代码public static <T, K, U> |
从参数表可以看出:
- 第一个参数:表示 key
- 第二个参数:表示 value
- 第三个参数:表示某种规则
上文中的Collectors.toMap(Person::getAge, v -> v, (k1,k2) -> k1)
,表达的意思就是将age
的内容作为key
,v -> v
是表示将元素person
作为value
,其中(k1,k2) -> k1
表示如果存在相同的key
,将第一个匹配的元素作为内容,第二个舍弃!
结尾
本文主要,围绕 jdk stream api 操作,结合实际的日常开发需求,做了简单总结和分享。希望你也能跟着一起敲一遍加深印象,相信都能掌握这些操作符的初步用法;后续文章我会带大家一步步深入Stream。看完了,希望你能点个赞,哈哈。
本文转载自: 掘金