曝阿里达摩院大模型 M6 带头人杨红霞已离职:个人选择,非行业原因

362d1d9bd225e19bb3c39b881f5bf7ca.jpeg

作者 | 李梅
来源 | AI科技评论

阿里 M6 大模型带头人杨红霞,已从阿里巴巴达摩院智能计算实验室离职。

AI科技评论获悉,阿里 M6 大模型的原带头人杨红霞,已于 9 月初因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。

杨红霞常年深耕在产业化大规模落地的人工智能相关技术,在任资深算法专家期间带领团队探索阿里在下一代人工智能突破性技术-认知智能的技术发展与场景应用落地。

264a28a029339634a799b674697fd120.png

杨红霞 ,2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。

博士毕业后,杨红霞先入职 IBM 全球研发中心任 Watson 研究员,之后入职雅虎公司,担任首席数据科学家。

2016 年,杨红霞结束她在美国近 10 年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。

杨红霞领导的阿里巴巴达摩院 M6 团队致力于认知智能方向,目前研发了 AliGraph、M6、洛犀等较为有影响力的人工智能开源平台和系统,发表顶级会议、期刊文章超过 100 篇,美国和中国专利超过 30 项。

她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),2020 年国家科学技术进步奖二等奖和 2020 年杭州市创新领军团队。2022年6月,杨红霞入选 2022 福布斯中国科技女性50榜。

大模型 M6 是杨红霞在任期间的最突出成就。据了解,她离职是因为个人家庭原因,而非行业问题。达摩院大模型 M6 团队的后续工作不受影响。

M6 于 2021 年 3 月首次发布,是国内首个千亿参数多模态大模型。当时,OpenAI 前政策主管 Jack Clark 曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。

作为通用性 AI 大模型,M6 拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。杨红霞曾在接受采访时表示:“多模态预训练是下一代人工智能的基础,M6 模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”

6 月份,杨红霞团队又发布万亿参数的 M6,仅使用 480 块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,功耗降低 8 成,效率提升 11 倍。

M6 在当年 10 月再次突破极限,杨红霞团队使用 512 GPU,在 10 天内训练出 10 万亿模型。与大模型 GPT-3 具有同等参数规模,但能耗仅为其 1%。

据了解,M6 已经在阿里新制造平台-犀牛制造中得到应用,它服务内部近 50 个部门,并在阿里云对外产品中投入使用,还被收录在 MIT Tech Review 2021 年度中国 AI 突破技术报告。

8a98ce422d945545b23d2c51e6393c6d.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 af46f040a8724ef85e3523f0b4d039d6.png

[1] https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc

[2] http://www2.stat.duke.edu/~hy35/home.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476861.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c#服务器后台搭建_【环境搭建】Docker简明安装教程

背景在前面的文章中介绍了docker,这里讲讲它的安装CZMan95:【环境搭建】Docker篇​zhuanlan.zhihu.com在服务器上安装docker的话还是有些操作,所以这里写个简明教程主要针对Linux服务器(Ubuntu),Windows和M…

程序员面试金典 - 面试题 05.01. 插入(位运算)

1. 题目 插入。给定两个32位的整数 N 与 M,以及表示比特位置的 i 与 j。 编写一种方法,将 M 插入 N,使得 M 从 N 的第 j 位开始,到第 i 位结束。 假定从 j 位到 i 位足以容纳 M,也即若 M 10 011,那么 j …

关于下一代IM服务器的一点想法

1、引言当前IM的站场上依旧硝烟弥漫,QQ, MSN, Google Talk, ICQ, Yahoo!还都在争夺着市场的份额。今天我所要说的,是跳出商业利益趋势之短利,而从长远的角度考虑IM的发展趋势。目前各大IM各自为政,在互相学习中提供着越来越丰富的…

一阶电路暂态响应的结果分析。_阻尼比测试方法及谐响应分析

谐响应分析中,阻尼比的确定是关键问题,工程中阻尼比经常是估计值,导致分析结果跟实际不符。阻尼对模态频率的影响很小,阻尼的主要作用是压低共振处的幅值,如果阻尼取为0的话,共振处的峰值会相当大&#xff…

Prompt IDE来了…是划时代AI神器还是鸡肋?

文 | 小戏在闲极无聊百无聊赖的刷着推特的时候,突然看到了这样一条消息让我手指一停。眼睛很快捕捉到了关键词,嗯?PromptIDE? 不知道大家看到 Prompt 和 IDE 这两个词组合在一起是一种什么样的感受,我的第一反应可能是“啊&#…

程序员面试金典 - 面试题 08.07. 无重复字符串的排列组合(回溯)

1. 题目 无重复字符串的排列组合。编写一种方法,计算某字符串的所有排列组合,字符串每个字符均不相同。 示例1:输入:S "qwe"输出:["qwe", "qew", "wqe", "weq", "ewq&…

(转)初次体验.net Ajax无刷新技术

早就听说Ajax技术了,传说中是一种很牛的东西,号称无刷新,其实是在web上通过javascript,使用异步的xmlhttp请求,实现无刷新的web界面。可惜一直没有体验过, 先后听做PHP的朋友用过PHP的Ajax开发包&#xff0…

提速256倍,斯坦福谷歌提出扩散模型蒸馏方法,效果接近Teacher

编辑 | 杜伟、陈萍来源 | 机器之心斯坦福大学联合谷歌大脑使用「两步蒸馏方法」提升无分类器指导的采样效率,在生成样本质量和采样速度上都有非常亮眼的表现。去噪扩散概率模型(DDPM)在图像生成、音频合成、分子生成和似然估计领域都已经实现…

移动数据网络类型是nr_便携式移动网络的快速搭建方法

在用户高峰时段,常用的移动网络很容易堵塞,不堪重负。所以,关键时刻能够建立安全可靠的通信,是非常重要的。在本案例中,我用的移动通信系统是GSM协议,为了能够将GSM协议广播出去,我使用了BladeR…

程序员面试金典 - 面试题 17.19. 消失的两个数字(数学/位运算)

1. 题目 给定一个数组,包含从 1 到 N 所有的整数,但其中缺了两个数字。 你能在 O(N) 时间内只用 O(1) 的空间找到它们吗? 以任意顺序返回这两个数字均可。 示例 1: 输入: [1] 输出: [2,3]示例 2: 输入: [2,3] 输出: [1,4]提示&#xff1a…

其实没事做,写写博客也不错的

以前一直很喜欢记录自己的一些事情,现在有博客这个东西了,但是懒得很,申请N多没有一个坚持记录下去的,希望在博客园可以好好安家。。今晚竟然看博客看到11.00了,要洗澡睡觉了。。明天要搞定PES、还要开会。。。事情有点…

python sorted下标_Python列表操作最全面总结

1.列表添加元素列表中可以使用append、insert、extend方法实现元素的添加。append会把新元素添加到列表末尾"a", insert(index, object) 在指定位置index前插入元素object"a", 通过extend可以将另一个集合中的元素逐一添加到列表中(合并)A [1, 2]B [3, 4…

BatchFormer:有效提升数据稀缺场景的模型泛化能力|CVPR2022

文 | 侯志知乎(已授权)源 | 极市平台摘要当前的深度神经网络尽管已经取得了巨大的成功,但仍然面临着来自于数据稀缺的各种挑战,比如数据不平衡,零样本分布,域适应等等。当前已经有各种方法通过样本之间的关…

程序员面试金典 - 面试题 16.06. 最小差(排序+双指针)

1. 题目 给定两个整数数组a和b,计算具有最小差绝对值的一对数值(每个数组中取一个值),并返回该对数值的差 示例: 输入:{1, 3, 15, 11, 2}, {23, 127, 235, 19, 8} 输出: 3,即数值对…

bigdecimal 保留两位小数_一起聊聊小数的储存和运算

原创: 蜀中亮子 玄说前端 小数运算的问题在 js 中的小数运算中,一直存在着一个问题,比如:0.10.20.30000000000000004 、0.4-0.30.10000000000000003。那么为什么会出现这种情况呢?这种情况又如何解决呢?为什…

从DeepFace到AdaFace,7篇论文讲清人脸识别

人脸识别是现在应用最广泛的视觉技术之一,同时也是前沿研究热点之一。我找来了深耕人脸的朋友张老师,从DeepFace到AdaFace,讲解deepface、facenet、vggface、sphereface、cosface、adaface等论文,给各位做一次人脸识别的系统分享。…

提升方法(Boosting)

文章目录1. 提升方法AdaBoost算法2. AdaBoost算法训练误差分析3. AdaBoost算法的解释4. 提升树5. sklearn 实例提升(boosting)方法是一种常用的统计学习方法,应用广泛且有效。 在分类问题中,它通过改变训练样本的权重&#xff0c…

在两个页面之间传递信息

在asp.net不同页面之间传值的方法主要有三种:(1)用querystring方法:在vs2005中新建asp.net网站(发送端),在页面上添加button,两个TextBox,代码如下:protectedvoidButton1_Click(objectsender, EventArgs e) { string url; u…

英特尔或将大幅裁员

编辑 | David来源 | 新智元受PC业务持续不振影响,曝英特尔计划裁员数千人,可能将影响20%的员工。据知情人士透露,英特尔公司正计划大幅裁员,人数可能达到数千人,以削减成本,应对不景气的个人电脑市场的萎缩…

pandas object转float_25个Pandas实用技巧

本文一共为大家分享25个pandas技巧,此为上篇~显示已安装的版本输入下面的命令查询pandas版本:In [7]:pd.__version__Out[7]:0.24.2如果你还想知道pandas所依赖的模块的版本,你可以使用show_versions()函数:In [9]:pd.show_version…