Java性能教程– Java 8流有多快?

在此JAX Magazine的预览预览中,JAX伦敦发言人Angelika Langer为使用Java流的任何人回答了最重要的问题:它们真的更快吗?

Java 8是JDK收集框架的主要新增功能,即流API。 与集合相似,流表示元素序列。 集合支持对单个元素起作用的操作,例如add()remove()contains() 。 相反,流具有批量操作,例如forEach()filter()map()reduce() ,它们访问序列中的所有元素。 Java流的概念受功能编程语言的启发,其中相应的抽象通常称为序列,该序列也具有filter-map-reduce操作。 由于这种相似性,Java 8(至少在某种程度上)除了其一直支持的面向对象范例之外,还允许一种函数式编程样式。

也许与普遍的看法相反,Java编程语言的设计人员没有扩展Java及其JDK来允许Java中的功能编程,也没有将Java变成“目标与功能”混合编程语言。 发明Java流的真正动机是性能,或者更确切地说,是使并行性更易于软件开发人员访问(请参见Lambda州的Brian Goetz )。 考虑到硬件的发展方式,这个目标对我来说很有意义。 我们的硬件今天有数十个cpu内核,将来可能还会有数百个。 为了有效利用硬件功能,从而达到最新的执行性能,我们必须并行化。 毕竟–在多核平台上运行单个线程有什么意义? 同时,多线程编程被认为是困难且容易出错的,这是正确的。 流有两种形式(顺序流和并行流),旨在隐藏运行多个线程的复杂性。 并行流使魔术般,轻松地并且以每个Java开发人员都可以访问的方式并行执行批量操作变得极为容易。

并行流操作是否比顺序操作快? 听到Angelika Langer在2015年JAX伦敦上的演讲。

因此,我们来谈谈性能。 Java 8流有多快? 一个普遍的期望是流操作的并行执行比仅单个线程的顺序执行要快。 是真的吗 流会提高性能吗?

为了回答有关性能的问题,我们必须进行衡量,即运行一个微基准测试。 标杆管理也很困难且容易出错。 您需要执行适当的预热,注意各种失真的影响,从虚拟机的JIT编译器应用的优化(消除臭名昭著的死代码)到硬件优化(例如,如果增加一个内核的cpu频率,则应注意)其他核心处于闲置状态)。 通常,必须以一粒盐作为基准结果。 每个基准都是实验。 其结果取决于上下文。 永远不要相信在硬件环境中尚未产生的基准数据。 这样说,让我们尝试一下。

将流与循环进行比较

首先,我们想了解流的批量操作与常规的传统for-比较。 首先出于性能考虑是否值得使用流?

我们将用于基准测试的序列是一个int-数组,其中填充了500,000个随机整数值。 在此数组中,我们将搜索最大值。

这是带有for-循环的传统解决方案:

int[] a = ints;
int e = ints.length;
int m = Integer.MIN_VALUE;
for(int i=0; i < e; i++)   if(a[i] > m) m = a[i];

这是使用顺序IntStream的解决方案:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

我们在具有适当预热功能的过时硬件(双核,无动态超频)上进行了测量,并得出了中途可靠的基准数据。 这是在特定情况下的结果:

int-array, for-loop : 0.36 ms
int-array, seq. stream: 5.35 ms

结果令人震惊:旧的for-循环比顺序流快15倍。 真令人失望! 多年的开发工作花费在为Java 8构建流上,然后进行此?!?!? 可是等等! 在得出流非常慢的结论之前,让我们看看如果用ArrayList <Integer>替换int- array会发生什么。

这是for-循环:

int m = Integer.MIN_VALUE;
for (int i : myList)if (i>m) m=i;

这是基于流的解决方案:

int m = myList.stream().reduce(Integer.MIN_VALUE, Math::max);

结果如下:

ArrayList, for-loop : 6.55 ms
ArrayList, seq. stream: 8.33 ms

同样, for-循环比顺序流操作要快,但是ArrayList上的差异不如在阵列上那么重要。

让我们考虑一下。 为什么结果相差这么大? 有几个方面需要考虑。

首先,访问数组元素非常快。 这是基于索引的内存访问,没有任何开销。 换句话说,这是简单的底层存储访问。 另一方面,通过迭代器访问集合中的元素(例如ArrayList),并且迭代器不可避免地增加了开销。 另外,对集合元素进行装箱和拆箱会产生开销,而int数组则使用普通原始类型int。 本质上,对于该ArrayList测量通过迭代和拳击开销而对于INT-阵列附图示出的优点是支配for-环路。

其次,我们是否曾认真地期望过流会比普通的for-loop更快? 编译器在优化循环方面拥有40多年的经验,虚拟机的JIT编译器尤其易于以与我们的基准测试相同的步伐来优化阵列上的for-循环。 另一方面,流是Java的最新添加,并且JIT编译器(尚未)尚未对其执行任何特别复杂的优化。

第三,我们必须记住,一旦掌握了序列元素,我们就不会做太多事情。 我们花了很多精力来尝试访问元素,然后对它进行的工作并不多。 我们只比较两个整数,在JIT编译后,它们几乎不止一个汇编指令。 因此,我们的基准测试说明了元素访问的成本–不一定是典型情况。 如果应用于序列中每个元素的功能是CPU密集型的,则性能指标将发生重大变化。 您会发现,如果功能受CPU的限制很大,则for循环流和顺序流之间将不再有可测量的差异。

加入我们的JAX伦敦-Java和软件创新者大会。 使用以下代码可享受10%的折扣:MP_JCG10

从该基准实验得出的最终结论并非并非流总是比循环慢。 是的,流有时比循环慢,但它们也可以同样快。 这要视情况而定。 带回家的要点是顺序流不会比循环快。 如果使用顺序流,则出于性能原因,请不要这样做; 之所以这样做,是因为您喜欢函数式编程风格。

那么,性能改进流是在哪里发明的呢? 到目前为止,我们仅将循环与流进行了比较。 并行化如何? 流的点是易于并行化,以实现更好的性能。

比较顺序流与并行流

作为第二个实验,我们想弄清楚顺序流与并行流在性能方面的比较。 并行流操作是否比顺序操作快?

我们使用填充500,000个整数值的同一int-数组。 这是顺序流操作:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

这是并行流操作:

int m = Arrays.stream(ints).parallel().reduce(Integer.MIN_VALUE, Math::max);

我们的期望是并行执行应该比顺序执行更快。 由于测量是在双核平台上进行的,因此并行执行最多可以是顺序执行的两倍。 理想情况下,顺序/并行性能之比应为2.0。自然地,并行执行确实会引入一些开销,用于拆分问题,创建子任务,在多个线程中运行子任务,收集其部分结果以及产生总体结果。 该比率将小于2.0,但应该接近。

这些是实际的基准测试结果:

sequential parallel seq./par.
int-array 5.35 ms    3.35 ms  1.60

通过我们的基准进行的现实检查得出的比率(顺序/并行)仅为1.6而不是2.0,这说明了并行执行涉及的开销量以及(在此特定平台上)如何(好坏)得到超额补偿。

您可能会倾向于概括这些数字并得出结论,并行流始终比顺序流快,也许不如人们希望的那样快(在双核硬件上),但是至少更快。 但是,事实并非如此。 同样,有许多方面有助于并行流操作的性能。

其中之一是流源的可拆分性。 数组可以很好地拆分; 只需进行索引计算就可以找出中间元素并将数组拆分为两半。 没有开销,因此几乎没有拆分成本。 与数组相比,集合拆分的难易程度如何? 拆分二叉树或链表需要什么? 在某些情况下,对于不同类型的集合,您将观察到截然不同的性能结果。

另一个方面是有状态性。 一些流操作保持状态。 一个示例是distinct()操作。 这是一个中间操作,可消除输入序列中的重复项,即它返回具有不同元素的输出序列。 为了确定下一个元素是否重复,操作必须与它已经遇到的所有元素进行比较。 为此,它维护某种数据结构作为其状态。 如果在并行流上调用distinct() ,则其状态将被多个工作线程并发访问,这需要某种形式的协调或同步,这会增加开销,从而减慢并行执行的速度,最大程度地降低了并行执行的程度。比顺序执行慢。

考虑到这一点,可以公平地说,流的性能模型并非微不足道。 幼稚地期望并行流操作总是比顺序流操作快。 性能提升(如果有的话)取决于许多因素,我在上文中简要提到了其中的一些因素。 如果您熟悉流的内部工作原理,则可以对并行流操作的性能做出明智的猜测。 但是,您需要进行大量基准测试,以便针对给定的上下文确定并行进行是否值得。 实际上,在某些情况下,并行执行要比顺序执行慢,并且在所有情况下盲目使用并行流可能会适得其反。

实现是:是的,并行流操作易于使用,并且通常比顺序操作运行得更快,但是不要指望奇迹。 另外,不要猜测; 相反,要进行很多基准测试。

这是《 JAX杂志》的先睹为快–在此处注册以获取更多免费的开发人员提示,趋势和教程。

翻译自: https://www.javacodegeeks.com/2015/07/java-performance-tutorial-how-fast-are-the-java-8-streams.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/357740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 开发

初学者学习 Android 开发&#xff0c;有什么好网站推荐&#xff1f; 前段日子一直在看安卓巴士这个网站&#xff0c;但网站突然进行改版&#xff0c;很多内容都找不到了&#xff0c;一下子怅然若失起来1 条评论 分享按投票排序按时间排序50 个回答 yava&#xff0c;半瓶水fei …

java迭代器删除重复元素_Java中的List删除重复元素

List接口做为Java集合框架中的一员&#xff0c;对数据的操作和处理比数组方便许多。在数组中插入一个元素要从数组的最后一个元素到当前插入的位置依次向后移动一位&#xff0c;然后为插入的位置进行赋值。在数组删除一个元素要从删除元素的下一个元素位置到数组最后一个元素依…

2021Golang技术基础知识及学习路线图

导读:Go 是一个开源的编程语言,它能让构造简单、可靠且高效的软件变得容易。 Go是从2007年末由Robert Griesemer, Rob Pike, Ken Thompson主持开发,后来还加入了Ian Lance Taylor, Russ Cox等人,并最终于2009年11月开源,在2012年早些时候发布了Go 1稳定版本。现在Go的开发…

SDWebImage的使用说明

1. 在需要的地方导入头文件 #import "UIImageViewWebCache.h" webCache:网络缓存&#xff0c;几乎目前所有的浏览器都有一个内置的缓存&#xff0c;它们通常利用客户端本地的内存和硬盘来完成缓存工作&#xff0c; 同时允许用户对缓存的内容大小作控制。 这个方法默认…

深入了解区块链技术及其常见误区

导读:区块链是一个信息技术领域的术语。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。基于这些特征,区块链技术奠定了坚实的“信任”基础,创造了可靠的“合作”机制,具有广阔的运用…

ztree java 增删改_Ztree实现增删改查

1.和另一篇文章--[TreeGrid 实现增删改查]前面的内容一致&#xff0c;只需要创建一个html页面&#xff0c;命名为ztree-01.html&#xff0c;粘贴如下网址的代码进入ztree-01.html。访问http://www.treejs.cn/v3/faq.php#_206复制这些代码html> ZTREE DEMO TITLE>HEAD>…

gwt api_使用RequestFactory API进行Spring GWT集成

gwt api从GWT 2.4开始&#xff0c;将RequestFactory API与后端的Spring服务集成很容易&#xff0c;您需要做的就是在服务器上创建一个自定义ServiceLocator&#xff0c;GWT将使用它来正确定位被调用的服务&#xff1a; public class SpringServiceLocator implements ServiceLo…

Android Studio导入项目非常慢的解决办法

问题 Android Studio目前已经更新到2.0 Preview 6了&#xff0c;作为Google大力推崇的开发工具&#xff0c;相对于Eclipse ADT有着不可比拟的优势。然而在实际使用时&#xff0c;依然有不少不爽的地方。Android Studio原生支持使用Gradle来构建项目本是个不错的想法&#xff0c…

AI时代——人工智能技术图谱,它来啦(机器学习+深度学习学习路线)

导读:人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作…

java线程代码实现_Java 实现线程的2种方法的具体代码实例

实现线程的众所周知的方法具体有如下2种&#xff1a;(1)继承Thread类&#xff0c;重写run方法(2)实现Runnable接口&#xff0c;重写run方法然后我做如下具体实例来测试。package com.lxk.threadTest;/*** 线程测试* * Created by lxk on 2016/11/12*/public class ThreadTest {…

编写下载服务器。 第五部分:油门下载速度

在僵尸网络时代&#xff0c;您可以租用几百美元来运行自己的分布式拒绝服务攻击&#xff0c;拥有紧急开关有选择地关闭昂贵的功能或极大地降低性能是一个巨大的胜利。 在缓解问题的同时&#xff0c;您的应用程序仍可运行。 当然&#xff0c;这种安全措施在高峰或工作时间也很有…

高内聚,低耦合——8大核心中间件,微服务基础技术栈技术图谱

什么是微服务? 维基上对其定义为:一种软件开发技术- 面向服务的体系结构(SOA)架构样式的一种变体,将应用程序构造为一组松散耦合的服务。在微服务体系结构中,服务是细粒度的,协议是轻量级的。 微服务(或微服务架构)是一种云原生架构方法,其中单个应用程序由许多松散耦…

java光标移动函数_文件内光标的移动 函数基础 定义函数的三种形式 函数的返回值 调用方式...

# with open(ra.txt, r, encodingutf-8)as f:# data1f.read()# print(>1>:,data1)# print(f.tell()) # 44 只有一种情况下&#xff0c;光标的意思是字符# data2f.read()# print(>2>:,data2) # 第一次有结果&#xff0c;第二次没有&#xff0c;第一次读取数据后光标…

JQuery学习笔记——JQuery基础

#&#xff0c;JQuery避免名称冲突的方法var jq jQuery.noConfilct();jq.ready( function(){jq("p").hidden();});就是为了避免和其他库中$冲突&#xff1b;#&#xff0c;在引用jquery的时候&#xff0c;可以考虑使用google或者微软的cdn的jquery链接&#xff1a;<…

DBA 技能图谱——数据库管理员不在迷茫

导读:DBA一般指数据库管理员。数据库管理员(Database Administrator,简称DBA),是从事管理和维护数据库管理系统(DBMS)的相关工作人员的统称,属于运维工程师的一个分支,主要负责业务数据库从设计、测试到部署交付的全生命周期管理。 目录 DBA 技能图谱 下载地址 DBA 技能…

java的六大_java程序员必备的六大工具!

原标题&#xff1a;java程序员必备的六大工具&#xff01;Java程序员都会有套工具来应对工作上的挑战。多年来&#xff0c;Java 程序员使用软件来完成他们的工作。有很多工具对他们是有用的&#xff0c;不过对于初入行的人员来说&#xff0c;寻找合适的工具是困难的&#xff0c…

用maven运行指定java类main方法

mvn exec:java -Dexec.mainClass"com.java2s.ide.App" 转载于:https://www.cnblogs.com/silvestris/p/5162264.html

dom4j和jaxb_JAXB,SAX,DOM性能

dom4j和jaxb这篇文章研究了使用多种不同方法将XML文档编组为Java对象的性能。 XML文档非常简单。 它包含一个Person实体的集合。 <?xml version"1.0" encoding"UTF-8" standalone"yes"?> <persons><person><id>person…

H5技能图谱——适合各阶段前端程序员的学习地图

导读&#xff1a;学过web前端的都知道&#xff0c;web前端开发主要包括结构、行为和表现。那么要做好web前端&#xff0c;必须知道哪些技能呢?今天孙叫兽给大家介绍web前端的学习地图。 目录 H5技能图谱 下载地址 H5技能图谱 是不是很简单呢&#xff0c;拿赶紧收藏起来学习…

java写exe程序实例_2012软考软件设计师辅导:利用JAVA执行本地EXE文件

曾经为了这样一个需求找了很多资料&#xff0c;今天终于学习到了&#xff01;如何利用java执行exe文件&#xff1f;使用java类Runtime&#xff0c;每个Java应用程序都有一个Runtime类实例&#xff0c;使应用程序能够与其运行的环境相连接。可以通过getRuntime方法获取当前运行时…