阿里云开源的Blink,计算能力很疯狂:一眨眼,全部都算好!

全世界只有3.14 % 的人关注了

数据与算法之美


前两天,阿里云宣布开源“计算王牌”——实时计算平台Blink,回馈给ApacheFlink社区。官方称,计算延迟已经降到毫秒级:浏览网页的时候,你只是眨了一下眼睛,但在淘宝、天猫处理的信息已经刷新了17亿次。


DataArtisans(Flink创始公司)的 CTO Stephan Ewen还兴奋地表示:“阿里巴巴是Flink最大的贡献者之一,很高兴阿里能将内部优化的Flink版本开源给社区,让开发者享受到更先进的计算能力。”


640?wx_fmt=jpeg


那么实时计算到底是什么呢?


随着互联网的发展,大数据量爆发给企业带来了很大的业务压力,需要有高吞吐、低延迟的大数据计算解决方案服务自己的大规模数据业务场景。

640?wx_fmt=jpeg

传统的计算方式是把数据按照一定的时间间隔保存下来,再进行计算,虽然这个时间间隔被不断缩短,但还是有一定的问题。比如可能造成网购时的“超卖”。

640?wx_fmt=jpeg

2004年,Google的三篇论文开启了离线大数据处理的篇章,其中MapReduce被各大公司作为数据处理的主要方案,但PB规模数据计算是MapReduce难以逾越的瓶颈。


此后Spark发展至今,用批处理方式将大数据计算带入了分钟级的反应延迟,但在动态调整、事物机制、延迟性、吞吐量等方面并不优秀。


如今,流式主导的分布式计算正在主导大数据计算引擎将企业带入近乎实时数据环境,代表就是flink,基于流来模拟批,在技术上有更好的扩展性。

640?wx_fmt=jpeg

Flink早期起源于德国柏林工业大学的一个研究项目Stratosphere,并于2014年4月捐献给Apache软件基金会,同时重新定位品牌为Flink,经过8个月孵化期,在2014年12月成功从Apache软件基金会毕业,成为Apache顶级项目,从此开始在大数据领域航行。


640?wx_fmt=jpeg


2015年的时候,Filnk几乎没有人知道,更没有人大规模使用。但在同年的大数据峰会Hadoop Summit上已经有声音说:感觉Flink出来之后,Hadoop就显得不怎么需要了……

640?wx_fmt=jpeg

阿里是全球第一批使用Flink做大数据计算引擎研发的公司,2015年就引入内部,但最早Flink只能支持小流量互联网场景的数据处理。


阿里觉得Flink很有潜力,决定进行改造,并把这个内部版本取名Blink,是英文眨眼的意思:“一眨眼,所有东西都计算好了!”

640?wx_fmt=jpeg

2016年,阿里和DA的创始人Kostas 和Stephan在当年的Hadoop Summit大会上做了唯二的两场Flink演讲。

 

Kostas提前看到了议程,感到相见恨晚,主动联系了阿里,希望阿里能用团队研究的成果影响社区。

 

阿里负责人深受感动:“从那时候开始就觉得,我们不仅得把阿里内部的业务做好,还要为Flink社区做贡献,把Flink社区做好。”

 

就这样,阿里跟组织“接上了头”,成为了Flink社区的核心成员,也成为Flink后来欣欣向荣的关键。

640?wx_fmt=jpeg

2016年同年,阿里开始尝试:让实时计算支撑“双11”上的实时机器学习任务。双11当天,数亿人在淘宝天猫搜索商品,他们的每次查看,点击,都会影响个性化的智能推荐,在下一秒就能看到为自己量身定做的宝贝推荐。而这背后的实时计算,都由 Blink 来支撑。

 

2017年双11,Blink又成功支持全集团(阿里巴巴、阿里云、菜鸟)所有交易数据的实时计算任务,也验证了Flink可以通过改造支持企业大规模数据计算的场景。

640?wx_fmt=jpeg

Blink最初上线只有数百台服务器,现在规模已达上万台,这样的规模在全球范围内也是屈指可数。基于Blink,内部积累起来的状态数据已达PB级;每天在Blink的计算平台上,处理的数据已经超过万亿条;在峰值期间可以承担每秒超过4.72亿次的访问,最典型的应用场景是阿里巴巴双11大屏。

640?wx_fmt=jpeg

经过最近4年的持续快速发展,Apache Flink社区已经培养出42名Committer和19名PMC Member,不断加入的新鲜血液为Apache Flink社区持续贡献代码,并推动社区健康快速的发展。

 

其中,阿里为Flink社区贡献近20万行代码改动,参与建立了首个Flink中文社区。

640?wx_fmt=jpeg

过去几年,Flink的采用量增长了125%。

 

国内,BAT三家中阿里巴巴和腾讯都已经完全拥抱了Flink。美团、滴滴和字节跳动三家新兴互联网企业也都以Flink作为主流技术方向开始建设:美团的实时计算集群也已经突破4000台规模,字节跳动的Flink生产集群规模更是已经令人惊讶的已经超过了10000台规模 。

 

国际上,Uber、Netflix等大企业也都已经用上了Flink,还有法国第三大移动通信运营商布衣格电信、全球第二大B2C在线零售商Otto、欧洲领先的在线时尚平台zalando等。

640?wx_fmt=jpeg

看到Blink开源的消息后,开源圈热议,相信计算正在进入一个更快、更好的时代!


640?wx_fmt=jpeg

640?wx_fmt=jpeg


版权归原作者所有,转载仅供学习使用,不用于任何商业用途,如有侵权请留言联系删除,感谢合作。


640?wx_fmt=jpeg

我们联合「机械工业出版社、图灵新知、人民邮电出版社、华东师范大学出版社、科学出版社」给大家精心挑选了 100 优秀数学读物免费 送给大家。包含:

640?wx_fmt=png

假如你想参与,在后台回复「锦鲤即可,数据与算法之美“史上最惨锦鲤”正在等你。

活动时间:1月30号至2月11号

结果公布时间:2月11号



640?wx_fmt=png精品课程推荐:

640?wx_fmt=png

640?wx_fmt=png

选购数学科普正版读物

严选“数学思维好物”

送给孩子的益智礼物   |   办公室神器

算法工程师成长阅读   |   居家高科技

理工科男女实用型礼物精选 

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

----640?点击头像关注----

640?wx_fmt=png

超级数学建模

640?wx_fmt=png

数据与算法之美

640?wx_fmt=jpeg

少年数学家

640?wx_fmt=jpeg

数锐学堂

640?wx_fmt=jpeg

惊喜酱(个人号)

640?wx_fmt=jpeg

玩酷屋COOL

640?wx_fmt=gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/301861.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NET问答: 如何用 C# 计算相对时间 ?

咨询区 Jeff Atwood:给定一个 DataTime 值,如何计算如下时间?比如说:2 小时前?3 天前?1 个月前?回答区 neuracnu:我在 DateTime 类上做了一个扩展方法,你可以给它传递未来…

有趣程序和让人捧腹大笑的注释,你的注释还不够骚

全世界只有3.14 % 的人关注了数据与算法之美一&#xff0c;这个是关于数组的操作&#xff0c;数据汪也是才知道&#xff0c;居然还有这种操作# include <stdio.h>int main(){ int num[] {1,2,3,4};printf("the 3[num] result is : %d\n", 2[num]);return 0;}结…

java linux下载文件_java 从linux 下载文件

public static void main(String[] args) {SshClient client new SshClient();try {ConsoleKnownHostsKeyVerification console new ConsoleKnownHostsKeyVerification();client.connect("192.168.13.51", 22);//IP和端口//设置用户名和密码PasswordAuthentication…

读jQuery之二十(Deferred对象)

Deferred对象是由 jQuery.Deferred 构造的&#xff0c;jQuery.Deferred 被实现为简单工厂模式。 它用来解决JS中的异步编程&#xff0c;它遵循 Common Promise/A 规范。实现此规范的还有 when.js 和 dojo。 $.Deferred作为新特性首次出现在版本1.5中&#xff0c;这个版本利用De…

.NET之盛派微信SDK简单操作

开篇语在6月5号&#xff0c;我报名去参加了微软举办的一个线下分享的技术市集&#xff0c;分享人是苏老师和赵老师(非常感谢)&#xff0c;其中苏老师讲述了关于一些容器的部署等操作(也可以观看我的历史文章)&#xff0c;其中关于部署的示例代码是使用盛派微信SDK做了一个对接微…

预售┃连锁反应装置积木好玩到尖叫!

▲数据汪特别推荐点击上图进入玩酷屋之前推荐的“小小机械师”成了孩子最受欢迎的玩具&#xff0c;玩了的孩子几乎没有不喜欢的。还有家长买多套送给朋友的孩子作为生日礼物。有家长来问&#xff0c;还有没有这种类型的新产品。和厂家咨询后&#xff0c;小木找到了一款“小小机…

java文件调用脚本_Java中调用文件中所有bat脚本

//调用外部脚本String fileipsnull;//所有的路径String[] filesnull;String fileipnull;//单个路径try {InputStream is Thread.currentThread().getContextClassLoader().getResourceAsStream("pdfconfig.properties"); //加载线程文件成为流Properties prop new …

VMware VSphere 虚拟化云计算学习配置笔记(四)

2:接下来配置安装vcenter-db&#xff0c;安装MS SQL 2008r2 在vcenter-db服务器上安装配置MS SQL 2008r2过程截图&#xff1a; 这里可能会要耐心等一下才会出现一下提示&#xff1a; 选择左边installation 之后出现右边第一项新的安装&#xff1a; 转载于:https://blog.51cto.c…

【招聘(北京)】今天誉讯(北京)有限公司招聘高级.NET软件开发前端工程师

.NET高级开发工程师薪水范围&#xff1a;18-25k工作职责1、负责公共平台开发与维护&#xff0c;根据网站发展对技术架构不断调整、对网站性能调优&#xff1b;2、完成详细需求的分析与设计&#xff0c;并完成相关技术文档&#xff1b;3、按照项目任务和项目计划&#xff0c;完成…

IT人回家过年的尴尬

全世界只有3.14 % 的人关注了数据与算法之美春节将至&#xff0c;有很多人已经踏上了返乡的旅途&#xff0c;回家开开心心过春节&#xff0c;归心似箭的心表明了他们对家乡的热爱&#xff0c;归心似箭的心显示了他们想念父母的情&#xff0c;归心似箭的心代表了他们对朋友的思。…

java 判断进程状态_获取远程服务器上 Java 进程的运行状态

为了安全考虑, 有些服务器会被限制登录. 本文介绍如何获取远程服务器上 Java 进程的运行状态.启动 jstatd 服务在服务器端启动 jstatd 服务后, 远程的机器可以通过 rmi 协议获取服务器上 Java 程序的运行状态.在服务器上创建 jstatd 的授权文件, 假设文件路径为/etc/jstatd.all…

彻底搞定C指针-函数名与函数指针[转]

一 通常的函数调用 一个通常的函数调用的例子&#xff1a; //自行包含头文件 void MyFun(int x); //此处的申明也可写成&#xff1a;void MyFun( int );int main(int argc, char* argv[]) {MyFun(10); //这里是调用MyFun(10);函数return 0; }void MyFun(int x) //这…

聊一聊Elasticsearch和MySQL的常用操作

前言 ElasticSearch&#xff0c;开源的搜索和数据分析引擎&#xff0c;也是名列前茅的 nosql。很多时候会想拿它和关系型数据库做对比&#xff0c;严格上它们是没有太多可比性的。不过把有的东西放在一起比较&#xff0c;会帮助我们快速去理解一些 ElasticSearch 的内容。老黄这…

入门Python,限时1元!

爆竹声中一岁除&#xff0c;春风送暖入屠苏。猪年来袭&#xff0c;小天先跟各位模粉拜年啦&#xff01;当然&#xff0c;小天还准备了限时福利送给大家~套路&#xff1f;不存在的&#xff01;限时9元1深度学习限时体验第一章 深度学习概述与计算机视觉挑战1.1深度学习概述1.2 挑…

java 线程访问控件_C#多线程与跨线程访问界面控件的方法

本文实例讲述了C#多线程与跨线程访问界面控件的方法。分享给大家供大家参考。具体分析如下&#xff1a;在编写WinForm访问WebService时&#xff0c;常会遇到因为网络延迟造成界面卡死的现象。启用新线程去访问WebService是一个可行的方法。典型的&#xff0c;有下面的启动新线程…

centos服务器解决vsftp连接时的“550 Create directory operation failed.”错误

在centos服务器中配置好vsftp后&#xff0c;开了root用户上传权限&#xff0c;也关了系统的防火墙&#xff0c;但ftp连接的时候依然还会出现 "550 Create directory operation failed." 错误&#xff0c;如何解决呢&#xff1f; 解决&#xff1a; 1、查看 SELinux 的…

使用 Bridge to Kubernetes 简化云端开发

当我们面对一个大型应用程序&#xff0c;它有大量的微服务&#xff0c;并希望完成一些功能开发&#xff1f;我们面临许多挑战&#xff0c;其中之一将是处理正确的环境&#xff0c;如何进行开发。我们知道&#xff0c;在团队中解决这个问题的最佳方法是将其容器化并在云上托管。…

菜鸟学习数据科学家 5 大误区

全世界只有3.14 % 的人关注了数据与算法之美你准备好要成为一名数据科学家&#xff0c;积极的参加Kaggle比赛和Coursera的讲座。虽然这一切都准备好了&#xff0c;但是一名数据科学家的实际工作与你所期望的却是大相径庭的。本文研究了作为数据科学家新手的5个常见错误。这是由…

java多线程 sycophantic_Java多线程volatile和synchronized总结

volatile是轻量级的synchronized&#xff0c;在多处理器(多线程)开发中保证了共享变量的“可见性”。可见性表示当一个线程修改了一个共享变量时&#xff0c;另外一个线程能读到这个修改的值。正确的使用volatile&#xff0c;能比synchronized的使用和执行成本更低&#xff0c;…

[BOOST] BOOST::Format

cout << format( "%1% says \"%2%\" to %1%.\n" ) % "Yousen" % "Hello";这句话将在标准输出上输出“Yousen says "Hello" to Yousen.”接下来简单说明一下format的用法。估计聪明人都猜到了&#xff0c;在格式化字符…