完整回放|上海创智/TileAI/华为/先进编译实验室/AI9Stars深度拆解 AI 编译器技术实践

在持续演进的 AI 编译器技术浪潮中,越来越多的探索正在发生、沉淀与交汇。12 月 27 日,Meet AI Compiler 第八期正是在这样的背景下与大家如期相见。

本期活动,我们邀请了来自上海创智学院、TileAI 社区、华为海思、先进编译实验室、AI9Stars 的 5 位专家,带来了覆盖软件栈设计、算子开发到性能优化的全链路分享。讲师们结合各自团队的长期探索,展示了不同技术路线在真实场景中的实现方式与取舍思路,让抽象概念有了更具体的落脚点。

有人带着最新的研究成果而来,也有人带着正在推进的工程问题走进现场。台上的分享精彩纷呈,现场讨论同样热烈:提问、互动、茶歇间的交流讨论,让话题不断被追问、补充和延展。分享不再是单向输出,而是逐渐形成了一场围绕 AI 编译器展开的长期对话。大家聊得根本停不下来,这也正是我们 AI Compiler Family 的魅力所在~

活动内容回顾

分享回顾

分享主题:TVM FFI: Open ABI and FFI for Machine Learning Systems

内容简介:TVM FFI 旨在解决机器学习系统生态割裂与互操作性难题。通过定义开放的 ABI 和 FFI 标准,该项目利用稳定的 C ABI 及 DLPack 实现零拷贝数据传递,打通了 PyTorch 等框架与底层编译器的连接。它支持跨语言高效调用,显著降低了多平台适配的工程成本。

观看本场分享,你将了解:

  1. 学习 TVM-FFI 通用标准,大幅降低跨语言 Mlsys 开发维护成本

  2. 了解并构建兼容未来的模块化 ML 生态

分享视频:【2025 Meet AI Compiler】TVM FFI: Open ABI and FFI for Machine Learning Systems_哔哩哔哩_bilibili

分享主题:TileRT:面向低延迟大模型推理的软硬件探索

内容简介:随着大模型跨入万亿参数,处理序列跨过百万 token,模型能力正在不断打破各项记录。然而,人们对模型极致计算速度的追求从未停止。一方面许多低延迟场景需要在秒级甚至毫秒级得到响应,如实时决策、博弈等场景;另一方面大模型训练进入 Agent 时代,超长序列的 rollout 时间成为主要瓶颈。

本报告介绍 TileRT 项目,从 AI 编译器、runtime、到架构设计的角度,思考如何构建针对极低延迟的大模型计算软件栈。

观看本场分享,你将了解:

  1. 了解大模型低延迟推理场景背景、重要性和未来展望

  2. TileRT 的技术挑战与实践分享

分享视频:【2025 Meet AI Compiler】TileRT:面向低延迟大模型推理的软硬件探索_哔哩哔哩_bilibili

分享主题:PyPTO:基于白盒编译的融合算子开发框架

内容简介:本次分享聚焦华为新推出的融合算子开发框架 PyPTO。它基于 Tensor/Tile 编程范式,通过聚焦核内 SRAM 管理、跨平台 PTO 指令集和 MPMD 运行时等技术,结合 Human-In-The-Loop 调优,以白盒编译方式实现高性能与易用性的统一。

观看本场分享,你将了解:

  1. 掌握原生为 SIMD 架构设计的融合算子开发框架 PyPTO 的设计理念与核心架构

  2. 掌握 PyPTO 聚焦于发挥用户的专家经验的白盒编译思想与 Human-In-The-Loop 调优精髓

  3. 掌握利用 PyPTO 提供的可视化工具,快速在昇腾平台开发出高性能融合算子的完整流程

分享视频:【2025 Meet AI Compiler】PyPTO:基于白盒编译的融合算子开发框架_哔哩哔哩_bilibili

分享主题:面向 Triton 编译器的编译优化实践

内容简介:本次分享聚焦面向 Triton 编译器的优化实践,系统介绍 Triton 的语言与编译器结构、生态演进与算子库开发方法,并深入覆盖 CPU/GPU/NPU 等多架构的关键优化技巧,展示构建高性能统一算子体系的完整路径。

观看本场分享,你将了解:

  1. Triton 生态的最新进展

  2. Triton 编译器在多架构(CPU/GPU/NPU)上的关键优化技术

分享视频:【2025 Meet AI Compiler】面向 Triton 编译器的编译优化实践_哔哩哔哩_bilibili

分享主题:AutoTriton:强化学习驱动的大模型Triton算子优化技术探索

内容简介:利用 CUDA 等语言编写高效内核是性能工程师的专属领域,随着 Triton 等编程框架的出现,内核可编程性有着重大飞跃。但开发人员仍然需要手动配置关键参数,限制了性能可移植性和广泛应用。本报告将介绍在大模型算子生成评价基准与模型方面的探索,并展望大模型在算子优化方面的巨大潜力。

观看本场分享,你将了解:

  1. 大模型赋能算子优化的相关工作及最新进展

  2. 大模型在算子优化领域的关键技术

分享视频:【2025 Meet AI Compiler】AutoTriton:强化学习驱动的大模型 Triton 算子优化技术探索_哔哩哔哩_bilibili

主办方及合作伙伴

HyperAI超神经(hyper.ai)作为国际领先的人工智能及高性能计算社区,旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务,助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。

访问官网:https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网:https://openbayes.com/

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程:https://mlc.ai/

TVM 中文文档:https://tvm.hyper.ai/

上海创智学院是汇聚顶尖大学、头部企业和科研机构联袂建设的新型人才培养机构。学院坚持「以学生为中心、以前沿为牵引」的培养理念,通过超高规格的师资、超常措施的培养、超凡条件的保障,探索具有中国特色的 AI 领军人才培养方案,致力于培养中国 AI 领军人才,打造世界人工智能创新高地。

活动支持

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1135994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手教程:如何正确驱动无源蜂鸣器发声

为什么你的无源蜂鸣器接上电源却不响?真相在这里你有没有遇到过这样的情况:把无源蜂鸣器往电路板上一焊,通电后却发现——它一声不吭?明明是有源蜂鸣器“滴”一下就响,怎么换成无源的,连个动静都没有&#…

Anthropic寻求3500亿美元估值融资100亿美元

据报道,距离上一轮融资不到两个月,Anthropic PBC正在与投资者洽谈再融资100亿美元。据《华尔街日报》今日消息,Coatue Management和GIC将牵头此轮融资。报道称,这将使Anthropic的融资前估值达到3500亿美元,几乎是9月份…

工业控制场景下QSPI协议通信稳定性深度剖析

工业控制场景下QSPI通信稳定性实战解析:从信号完整性到系统鲁棒性你有没有遇到过这样的问题?一台工业HMI设备,在实验室里跑得好好的,一搬到工厂现场就频繁“启动失败”?日志显示QSPI读取超时,Flash无法识别…

打卡信奥刷题(2666)用C++实现信奥题 P2863 [USACO06JAN] The Cow Prom S

P2863 [USACO06JAN] The Cow Prom S 题目描述 有一个 nnn 个点,mmm 条边的有向图,请求出这个图点数大于 111 的强连通分量个数。 输入格式 第一行为两个整数 nnn 和 mmm。 第二行至 m1m1m1 行,每一行有两个整数 aaa 和 bbb,表示有…

DDOIProxy.dll文件丢失找不到问题 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

LeetCode 470 用 Rand7() 实现 Rand10()

文章目录摘要描述题解答案题解代码分析第一步:为什么是 (rand7() - 1) * 7 rand7()第二步:为什么只取 [1,40]第三步:为什么不会死循环示例测试及结果时间复杂度空间复杂度总结摘要 LeetCode 470 这道题乍一看像是“随机数题”,但…

CES 2026 | 重大更新:NVIDIA DGX Spark开启“云边端”模式

作者:毛烁算力日益增长的需求与数据搬运效率之间的矛盾,在过去两年尤为尖锐。当开源模型的参数量级迈过 100B(千亿)门槛, MoE(混合专家)架构成为主流,数百万开发者和科研人员尴尬地发…

es客户端查询DSL在日志系统中的应用:全面讲解

如何用好ES客户端与DSL,在日志系统中实现高效精准查询 在微服务和云原生架构大行其道的今天,一个中等规模的系统每天产生的日志动辄数GB甚至TB级。传统的“ grep 日志文件”模式早已不堪重负——你不可能登录十几台机器去翻滚动日志,更别提…

WaitMutex -FromMsBuild -architecture=x64”已退出,代码为 6

c 编译时报错:命令“"D:\Program Files\Epic Games\UE_5.6\Engine\Build\BatchFiles\Build.bat" demo_56_cEditor Win64 Development -Project"D:\projcect\ue_3d\demo_56_c\demo_56_c.uproject" -WaitMutex -FromMsBuild -architecturex64”已…

通俗解释nmodbus4在自动化产线中的角色

一条产线的“翻译官”:nmodbus4如何让上位机听懂PLC的语言 在一家智能制造工厂的中央控制室里,工程师小李正盯着大屏上跳动的数据流——温度、压力、电机转速……这些来自几十台设备的信息,最终都汇聚到他开发的一套.NET工控软件中。而连接这…

工业现场声音报警实现:有源蜂鸣器和无源区分手把手教程

工业现场声音报警实现:有源蜂鸣器和无源区分手把手教程从一个“不响的蜂鸣器”说起上周,一位做PLC扩展模块的工程师在群里发问:“我板子上的蜂鸣器怎么就是不响?电压测了有,IO也翻转了,代码没问题……”很快…

Gmail新增Gemini驱动AI功能,智能优先级和摘要来袭

谷歌公司正在对Gmail进行全面改革,将Gemini驱动的人工智能功能深度整合到其旗舰邮件服务中,力图将其转变为"个人、主动的收件箱助手"。今日推出的这些更新代表着谷歌迄今为止最积极推动AI自动化常态化的举措之一,可能会升级与微软公…

【Zabbix 多渠道报警全攻略(附图文教程):钉钉 / 企微 / 飞书 / 邮箱配置,含前置环境搭建(监控项、触发器、脚本与动作创建)、完整配置流程(脚本添加、媒介创建、关联授权)与功能测试】

提示:本文原创作品,良心制作,干货为主,简洁清晰,一看就会 Zabbix钉钉/企微/飞书/邮箱报警一、前置环境1.1 实验环境介绍1.2 创建监控项1.3 创建触发器1.4 创建脚本1.5 创建动作1.6 测试nginx能否重启二、钉钉报警2.1 创…

逻辑回归中的条件概率

这个式子 读作:“在已知 x 的条件下,y1 的概率”。 1) 每个符号分别是什么意思? y:要预测的“标签/结果”。 在二分类里通常 y∈{0,1}。 例:垃圾邮件 y1,正常邮件 y0。 x:输入特征(…

从零实现:搭建ARM64蓝屏调试环境并进行WinDbg分析

手把手搭建ARM64蓝屏调试环境:从零开始用WinDbg定位系统崩溃你有没有遇到过这样的场景?一台搭载骁龙处理器的Windows on ARM笔记本突然蓝屏,重启后只留下一个MEMORY.DMP文件,而你面对这个“黑盒”毫无头绪。更糟的是,网…

DevicePairingFolder.dll文件丢失找不到问题 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

研究发现商业AI模型可完整还原《哈利·波特》原著内容

机器学习模型,特别是商业模型,通常不会公开开发者用于训练的数据集。然而,模型包含哪些内容以及这些材料是否能通过特定提示被提取出来,仍然是具有经济和法律后果的重要问题,更不用说伦理和隐私方面的考量。 Anthropic…

DDACLSys.dll文件丢失找不到问题 免费下载分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

Pspice在OrCAD Capture中的仿真探针使用深入解析

Pspice仿真探针实战指南:如何在OrCAD Capture中精准捕获电路行为你有没有遇到过这样的场景?花了半小时搭好一个Buck电路,信心满满地跑完瞬态仿真,结果打开波形一看——关键节点没监控、电流纹波看不见、效率曲线还得手动算。更糟的…

ddodiag.exe文件丢失找不到问题 免费下载方法

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…