蚂蚁金服开放计算架构:下一代金融级计算架构

当前互联网技术早已进入了大数据、人工智能的阶段,各种计算模式,计算引擎层出不穷。从10年前的MapReduce分布式计算开始,几乎每三年就会出现一次新的计算引擎更迭,从开山鼻祖的Hadoop,到后来流式计算的Storm,之后出现了基于内存迭代计算的Spark红极一时,然后到今天Flink又以迅雷不及掩耳之势走入大家的视野。同时不仅仅是数据计算,机器学习框架最近几年也是层出不穷:Keras,PyTorch,Caffe2,TensorFlow……可以说每一个计算引擎的兴起,都意味着计算技术一次新的突破。

伴随着计算引擎的发展,如今互联网商业服务越发依赖大数据及人工智能技术,从最初的数据仓库分析型业务,已经逐渐演变成现在实时性更强,复杂度更高的智能决策服务。

两者的结合为更多的商业创新带来可能,但是背后的技术现象却是技术体系越发庞大与复杂,各个计算引擎的交替使用带来学习成本的直线飙升,同时研发成本的增加与效率的降低也是普遍问题。比研发效能降低更为糟糕的是不同的计算引擎之间数据无法共享及打通,绝大多数场景需要使用中间存储进行转储,造成了存储资源的浪费与数据量的成倍放大。除此之外,诸如缺少统一元数据,存在数据安全等隐患始终威胁着日益庞大且臃肿的系统体系。

面对这些不可忽视的问题,蚂蚁金服在2018年提出了开放计算架构的概念,希望通过设计一套符合当下计算体系,同时又能应对未来计算趋势的技术框架,来解决计算引擎更新、统一研发体系、数据共享互通、数据风险防控等几方面问题。

首先在计算引擎方面,开放计算框架认为计算引擎始终是持续更新的,因此需要有一套统一的元数据及状态管理,针对不同的计算作业状态进行统一管理,达到兼容任何一种计算引擎,并且实现插件化能力;另外在研发层面,不同的计算引擎有不同的研发模式与API接口,要想统一各种引擎的研发能力,需要在顶层进行计算DSL的封装。为此,我们推出了SmartSQL,在标准SQL规范之上扩展了部分功能及语法,希望用最简单通用的语言,描述绝大部分的计算及机器学习作业;另外,为了解决多种引擎数据无法打通及共享的问题,蚂蚁金服自主研发了统一存储系统,支持多种类型的数据存储格式,同时支持一份数据不同格式之间的自动转换及迁移,极大地简化了引擎层对存储的使用,同时节约了大量成本。

不只是传统的计算及存储形态,在目前的互联网服务中有大量的关系型数据,同时诸如社交,风控,反洗钱,营销等场景都对关系计算有大量的需求,因此图计算作为一种新的数据形态也是蚂蚁金服重点投入的领域。在开放计算架构之中,包含了离/在线一体的图计算引擎及存储,从使用场景,可以覆盖在线、实时、离线各个场景,用于支持不同时效性的业务。从功能上,具备金融级图数据库,超大规模图计算,流图混合的动态图计算以及超快内存图等计算能力,覆盖了不同量级的数据计算能力。另外与其他计算引擎一样,蚂蚁金服也研发了基于SQL规则的Graph SQL作为统一图查询语言,用于覆盖所有的图计算引擎。

在机器学习方面,开放计算架构还包含了之前已经开源的SQLFlow以及刚刚推出的ElasticDL弹性深度学习框架。SQLFLow作为连接数据与训练的桥梁,在标准SQL的基础上扩展了针对机器学习的语法,让数据分析人员可以像写SQL一样训练出自己的数据模型。另外SQLFlow支持市面上大多数机器学习引擎,以及ElasticDL弹性框架。ElasticDL是基于k8s体系的弹性深度机器学习框架,兼容TensorFlow引擎与Keras语法,通过弹性调度达到减少训练等待时间以及训练运行时间的目的。

这一整套体系又称为Big Data Base,就是蚂蚁金服摸索出来的金融数据智能的最佳实践,即下一代大数据的基石。

在9月27日杭州云栖大会第三天,蚂蚁金服将在数字金融技术专场上分享开放体系下的金融数据实践,包括蚂蚁开放计算架构的技术细节,欢迎届时关注。


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/517786.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业实战_09_MyCat 搭建Mysql 一主三从复制环境

接上一篇:企业实战_08_MyCat 搭建Mysql 一主二从复制环境 https://gblfy.blog.csdn.net/article/details/118651265 文章目录一、解决同步和数据初始化1. 主节点node1脚本同步2. 数据初始化二、创建复制链路2.1. 登陆数据库2.2. 建立复制的链路2.3. 查看链路2.4. 设…

Python开发之:Django基于Docker实现Mysql数据库读写分离、集群、主从同步详解 | 原力计划...

作者 | Pythonicc责编 | 王晓曼出品 | CSDN博客简介1、什么是数据库读写分离读写分离,基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致…

基于Flink和规则引擎的实时风控解决方案

对一个互联网产品来说,典型的风控场景包括:注册风控、登陆风控、交易风控、活动风控等,而风控的最佳效果是防患于未然,所以事前事中和事后三种实现方案中,又以事前预警和事中控制最好。 这要求风控系统一定要有实时性…

分辨垃圾材质自动分类 支付宝升级垃圾分类AI回收箱

塑料罐、易拉罐、玻璃瓶分别怎么丢?在今天召开的云栖大会现场,支付宝推出了智能垃圾箱,可对各类不同材质的饮料瓶自动识别、分类丢弃,为行业领先。智能垃圾箱是蚂蚁金服首次在业内推出SKU粒度的垃圾识别技术,借助机器视…

企业实战_10_MyCat Mysql 主复制总结

接上一篇:企业实战_09_MyCat 搭建Mysql 一主三从复制环境 https://gblfy.blog.csdn.net/article/details/118652450 使用master-data2记录事务日志点 先把主数据库的存量数据,备份成一个bak_xxx.sql文件,依次导入到从服务器中,增量…

结构化大数据分析平台设计

前言 任何线上系统都离不开数据,有些数据是业务系统自身需要的,例如系统的账号,密码,页面展示的内容等。有些数据是业务系统或者用户实时产生的,例如业务系统的日志,用户浏览访问的记录,系统的…

接口的定义与实现(重要)

接口的定义与实现(重要) 普通类:只有具体实现 抽象类:具体实现和规范(抽象方法)都有! 接口:只有规范!自己无法写方法 接口就是规范,定义的是一组规则&…

没错,你离分布式搜索只差一个Elasticsearch入门!

来源 | 沉默王二责编 | Carol封图 | CSDN 付费下载自视觉中国学习真的是一件令人开心的事情,上次分享了Redis 入门的文章后,收到了很多小伙伴的鼓励,比如说:“哎呀,不错呀,通俗易懂,十分钟真的入…

蚂蚁金服总裁胡晓明:科技如何驱动金融从离线走向在线

今天,2019阿里云栖大会在杭州云栖小镇开幕。蚂蚁金服的展区吸引到不少关注金融创新的“同道中人”。 除了亲身体验蚂蚁金服在金融科技领域的创新技术,蚂蚁金服集团总裁胡晓明特别在主论坛发表题为《数字经济时代的金融科技》的主题演讲,分享数…

企业实战_15_MySql主从复制到MyCat总结

接上一篇:企业实战_14_MyCat跨分片查询_全局表 https://gblfy.blog.csdn.net/article/details/100059621 文章目录一、主从复制到MyCat总结1. 数据库架构升级持之分库二、为什么数据库要进行垂直拆分?2.1. 优点2.2. 缺点三、 解决跨分片关联的方式3.1. 使…

1万亿次、10亿人、10亿张,科技给生活带来多少改变?

云栖大会精彩进行中,今天,是 Day-2。 一早,阿里技术明星团闪亮登场! 贾扬清:阿里巴巴副总裁、阿里云智能计算平台事业部总经理、高级研究员 李飞飞:阿里巴巴副总裁、阿里云智能数据库产品事业部总经理、高级…

N种内部类

N种内部类 内部类就是一个类的内部在定义一个类,比如,A类中定义一个B类,那么B类相对A类来说就称为内部类,而A类相对B类来说就是外部类了。 成员内部类 静态内部类 局部内部类 匿名内部类 package com.oop;import com.oop.De…

“编程能力差,90%输在了数学上!”CTO:其实你们都是瞎努力!

01从未得到过重视的问题一流程序员学数学,二流程序员学算法,低端看高端就是黑魔法。可能有人以为这就是个段子,但有过工作经验的都知道,这其实就是程序员的真实写照!想一想,我们学习、求职、工作的场景中&a…

云原生时代|分布式系统设计知识图谱(内含22个知识点)

我们身处于一个充斥着分布式系统解决方案的计算机时代,无论是支付宝、微信这样顶级流量产品、还是区块链、IOT等热门概念、抑或如火如荼的容器生态技术如Kubernetes,其背后的技术架构核心都离不开分布式系统。 为什么要懂分布式架构 系统学习分布式架构…

mysq启动失败

文章目录一、一站式解决1. 问题分析定位二、特殊场景2.1. 问题分析定位2.2. 解决方案2.3. 解决方案2一、一站式解决 1. 问题分析定位 # 找到MySQL的配置文件,复制mysql的数据目录 vim /etc/my.cnf# 进入msyql的数据目录 cd /data/mysql# 查看日志文件 vim mysql.e…

藏不住了,这就是阿里 AI 的真正实力!

不好意思,我要放大招了! 在今天的杭州云栖大会上,阿里巴巴首次公布人工智能调用规模: 每天调用超 1万亿 次 服务全球 10亿 人 日处理图像 10亿 张 视频 120万 小时 语音 55万 小时 自然语言 5千亿 句 在AI芯片、AI云服务、AI算…

Error和Exception(异常)

Error和Exception(异常) 掌握以下三种类型的异常:检查性异常:最具代表的检查性异常是用户错误或问题引起的异常,这是程序员无法预见的。例如打开一个不存在文件时,一个异常就发生了,这些异常在…

Kubernetes 是如何调度的?

作者 | 阿文,责编 | 郭芮头图 | CSDN 下载自东方IC出品 | CSDN(ID:CSDNnews)自互联网出现以来 ,云计算的概念已经提出了有 50 年。从1957 年,John McCarthy 将计算机中的分时共享概念设计成了一种工具。从此…

# Schedulerx正式登陆Ali-k8s应用目录

简介 分布式任务调度 SchedulerX 是阿里巴巴基于 Akka 架构自研的的分布式任务调度平台,今天正式登陆阿里云容器服务Kubernetes应用目录,支持用户以云原生的方式获取定时、工作流任务编排、分布式批量调度等功能,同时具有高可靠、海量任务、…

企业实战_01_ Mycat 主要作用_01

mycat主要作用 实现后端数据库的读写分离及负载均衡 企业实战_02_MyCat基本元素 https://gblfy.blog.csdn.net/article/details/118770154