《AI工程技术栈》:三层结构解析,AI工程如何区别于ML工程与全栈工程

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

《AI工程技术栈》:三层结构解析,AI工程如何区别于ML工程与全栈工程

由Gergely Orosz与Chip Huyen联合发布
2025年5月20日

在2025年6月16日周一,于伦敦举办的LDX3大会将迎来《务实工程师(The Pragmatic Engineer)》播客的现场录制环节。该环节是当日大会的闭幕环节,嘉宾为Shopify工程负责人Farhan Thawar。两人将围绕以下议题展开讨论:

  • Shopify的“反射式AI使用”策略如何重塑其工程团队工作方式

  • 全远程团队如何实现快速迭代

  • 一种非传统的工程职业成长路径:追求精通与工艺

  • 以及Shopify作为一家极具创新性的科技公司是如何高效运作并实现目标的

当天Gergely本人还将发表大会主旨演讲,听众将有机会现场见到《务实工程师》团队成员,包括Elin与Dominic。如果无法亲临现场,录制内容也将在事后通过播客发布。

接下来进入正题——AI工程技术栈的核心内容。

AI工程的崛起与背景

“AI工程”一词在两年前还鲜有人知,但如今,AI工程师成为科技行业的紧缺人才。不少企业如Meta、Google、Amazon等给予AI工程岗位比普通软件工程师更高的薪酬待遇,AI初创公司与规模型企业也在大力争抢相关人才。

但进一步观察可以发现,很多AI工程师其实是熟练掌握大型语言模型(LLM)基础操作并能实现集成的资深软件工程师。

在这一领域,目前最具代表性的著作之一是Chip Huyen于2025年初由O’Reilly出版社出版的《AI Engineering》。作者曾在Netflix担任研究员,在NVIDIA核心开发NeMo生成式AI框架,并共同创办Claypot AI,同时还曾于斯坦福大学教授机器学习课程。

本文引用该书第一章节选,旨在深入介绍AI工程栈的结构,解析AI工程如何从机器学习(ML)工程发展而来,又如何区别于全栈开发。


AI工程三层技术栈概览

AI应用的技术栈可拆解为三层:应用开发层、模型开发层与基础设施层。开发AI应用通常从顶层的应用开发开始,逐层深入至模型与基础设施:

  1. 应用开发层(Application Development)
    近年来最活跃的领域,主要任务包括输入优质提示词(prompts)与上下文信息给模型,并构建评估机制与人机交互接口。

  2. 模型开发层(Model Development)
    涉及模型的训练、微调、推理优化等工作,以及数据集的设计与管理。

  3. 基础设施层(Infrastructure)
    包括模型部署、数据与计算资源管理、系统监控等。

研究者在GitHub上检索了星标数量超过500的AI相关开源仓库,发现自Stable Diffusion与ChatGPT问世后,AI工具类仓库数量大幅上升,尤其以应用开发层最为显著,而基础设施层相对稳定。这表明尽管模型与应用迅速演进,资源调度与服务管理的底层基础设施变化较小。

尽管AI模型能力突飞猛进,但企业级应用依旧需要通过商业指标与机器学习指标的映射,并进行系统性实验与持续反馈优化。这些依旧沿袭传统ML工程的核心逻辑。


AI工程 vs. ML工程:核心差异

尽管AI工程继承了大量ML工程的基础方法,其核心区别包括:

  • 无需自行训练模型:AI工程往往使用已有基础模型,侧重于模型适配与使用,而非从零训练。

  • 模型规模更大,资源需求更高:AI工程面对更高的延迟与算力开销,因此对推理效率的优化要求更高,工程师需掌握GPU集群调度与资源管理。

  • 开放式输出评估难度更大:传统ML任务如欺诈检测有标准答案,但AI模型面对开放式问题(如写一篇文章)时,难以设定标准输出,导致评估成为更大挑战。

因此,AI工程重点在于适配与评估模型。适配方式分为两类:

  • 基于提示的适配(Prompt Engineering):通过上下文与指令控制模型行为,不涉及模型权重修改,适合入门和快速实验。

  • 微调(Fine-tuning):需要修改模型参数,提升模型性能,但要求更多数据与更复杂操作。


模型开发层详解

该层工作传统上归属ML工程,包含:

  1. 建模与训练:涉及模型架构选择、训练方法、微调等,需要深厚ML理论基础。

  2. 数据集工程:AI工程更偏向处理非结构化数据,重视去重、标注、上下文构建,尤其在开放式输出场景下标注难度激增。

  3. 推理优化:目标是让模型更快、更便宜。基础模型通常为自回归生成,每次生成一个token,生成长文本会导致较高延迟,这对用户体验与成本均是挑战。

此外,作者还对预训练(pre-training)、**微调(fine-tuning)后训练(post-training)**之间的区别做了详尽说明。


应用开发层详解

随着大模型普及,众多团队使用相同模型,差异化更多体现在应用开发层

  1. 评估(Evaluation)
    核心在于选择合适模型、检验效果与部署准备情况,尤其因开放式输出不具备“标准答案”,需多维度指标进行评估。例如Google在发布Gemini时,通过不同提示工程策略改变模型表现,显示出评估受提示工程影响巨大。

  2. 提示工程(Prompt Engineering)与上下文构建
    通过不同输入设计改变模型表现效果,任务复杂时需提供内存管理机制协助模型保持对话历史。

  3. AI接口设计(AI Interface)
    包括网页、桌面、移动端应用,浏览器插件、聊天机器人(如Slack、微信、Discord),以及API插件集成方式(如GitHub Copilot、Grammarly)。新兴AI接口设计也带来新的用户反馈收集方式。


AI工程 vs. 全栈开发

随着接口设计比重提升,AI工程越来越接近于全栈开发。传统ML工程以Python为核心语言,但如今也出现了JavaScript生态支持,如LangChain.js、OpenAI Node库、Vercel AI SDK等。

全栈开发者凭借前端与产品构建能力,在当前AI模型随取即用的环境中,可以先建产品、后训练模型,快速实现想法、获取反馈并快速迭代。

如图所示(图1-16),全新的AI工程流程更重视产品与用户,而非一开始即深耕建模。


总结

本章节旨在阐明AI工程作为一门独立学科的兴起背景及其核心开发流程。AI工程虽然源自ML工程,但又有所区别。其突出特征是建立在基础模型上的开发流程创新,以及如何以最快速度将AI能力转化为具备实用价值的产品。

AI工程不仅是技术的革新,更是社区创造力的集中体现。虽然知识更新速度惊人,但也正因如此,更需要系统框架来帮助从业者理解与应对变化。

本书将以本章为起点,逐步展开对整个AI工程流程的深入讲解,从支持这一切的基础模型出发,帮助读者全面掌握AI时代的核心工程能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/84039.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis数据库-消息队列

一、消息队列介绍 二、基于List结构模拟消息队列 总结: 三、基于PubSub实现消息队列 (1)PubSub介绍 PubSub是publish与subscribe两个单词的缩写,见明知意,PubSub就是发布与订阅的意思。 可以到Redis官网查看通配符的书写规则: …

归一化函数 & 激活函数

目录 Softmax函数 定义 输入输出 例子 总结 Layernorm 定义 输入输出 Sigmoid函数 定义 Tanh函数 定义 Relu函数 定义 Elu函数 定义 Gelu函数 定义 总结 Softmax函数 定义 softmax函数又称归一化指数函数,其作用是将一个 n 维的实值向量转换为…

使用 C# 入门深度学习:线性代数详细讲解

在深度学习的领域中,线性代数是基础数学工具之一。无论是神经网络的训练过程,还是数据的预处理和特征提取,线性代数的知识都无处不在。掌握线性代数的核心概念,对于理解和实现深度学习算法至关重要。在本篇文章中,我们…

【通用智能体】Serper API 详解:搜索引擎数据获取的核心工具

Serper API 详解:搜索引擎数据获取的核心工具 一、Serper API 的定义与核心功能二、技术架构与核心优势2.1 技术实现原理2.2 对比传统方案的突破性优势 三、典型应用场景与代码示例3.1 SEO 监控系统3.2 竞品广告分析 四、使用成本与配额策略五、开发者注意事项六、替…

CICD遇到npm error code EINTEGRITY的问题

场景 CICD编译时抛出npm error code EINTEGRITY的错误 npm error code EINTEGRITY npm error sha512-PlhdFcillOINfeV7Ni6oF1TAEayyZBoZ8bcshTHqOYJYlrqzRK5hagpagky5o4HfCzzd1TRkXPMFq6cKk9rGmA integrity checksum failed when using sha512: wanted sha512-PlhdFcillOINfeV…

Android13 wifi设置国家码详解

Android13 wifi设置国家码详解 文章目录 Android13 wifi设置国家码详解一、前言二、设置wifi国家码相关代码1、adb或者串口也能设置和获取当前国家码(1)查询命令的方式(2)获取和设置国家码的示例 2、Java代码设置国家码3、获取当前…

c/c++的opencv高斯模糊

深入探索图像高斯模糊:原理、C/C实现与OpenCV应用 在图像处理的众多技术中,模糊(或平滑)是最为基础且不可或缺的一环。它广泛应用于降噪、图像预处理、特征提取前的平滑以及计算机图形学中的各种视觉效果。在高斯模糊&#xff08…

Java求职者面试:从Spring Boot到微服务的技术点解析

Java求职者面试:从Spring Boot到微服务的技术点解析 场景:互联网医疗-预约挂号系统 面试官: “小明,我们今天的场景是一个互联网医疗的预约挂号系统。我们需要支持高并发的用户预约操作,同时保证数据一致性和系统的高…

专业 YouTube SEO 方案:打造高排名视频的关键步骤

YouTube 是全球订阅量最高的社交媒体平台之一。YouTube 为发布创意视频内容和针对特定受众开展营销活动提供了无限可能,是任何品牌内容营销策略的重要组成部分。 但是,为了发展您的 YouTube 频道并消除噪音,优化您的视频内容以便可以在搜索结…

Java Collection(集合) 接口

Date: 2025-05-21 20:21:32 author: lijianzhan Java 集合框架提供了一组接口和类,以实现各种数据结构和算法。 以下是关于 Java 集合的核心内容说明: /*** Java Collection Framework 说明:** 在 Java 中,集合(Collec…

如何用ipmitool修改FRU信息?

如何用ipmitool修改FRU信息? FRU(Field Replaceable Unit,现场可更换单元)记录了服务器硬件的关键信息,如序列号、制造商、型号等。通过ipmitool修改FRU信息,常用于硬件维护、资产标签更新或调试场景。以下…

uniapp vue 开发微信小程序 分包梳理经验总结

嗨,我是小路。今天主要和大家分享的主题是“uniapp vue 开发微信小程序 分包梳理经验总结”。 在使用 UniAppvue框架开发微信小程序时,当项目比较大的时候,经常需要分包加载。它有助于控制主包的大小,从而提升小程序的启…

git合并多次commit提交

首先查看历史记录 git log 查看你想要合并的commit是哪些(注意:这里是逆序,最上的是最新提交) 找到当前想要合并的最后一个记录,复制该记录的下一个记录的 id(黄色部分commit id)&#xff0c…

系统架构设计(七):数据流图

定义 数据流图(Data Flow Diagram, DFD)是一种用于表示信息系统数据流转及处理过程的图形工具。 它反映系统功能及数据之间的关系,是结构化分析与设计的重要工具。 主要符号 符号说明描述举例方框外部实体(源或终点&#xff09…

MAUI与XAML交互:构建跨平台应用的关键技巧

文章目录 引言1. 代码隐藏文件关联1.1 XAML文件与代码隐藏文件的关系1.2 部分类机制1.3 InitializeComponent方法1.4 XAML命名空间映射 2. 元素名称与x:Name属性2.1 x:Name属性的作用2.2 命名规则与最佳实践2.3 x:Name与x:Reference的区别2.4 编译过程中的名称处理 3. 在代码中…

php://filter的trick

php://filter流最常见的用法就是文件包含读取文件,但是它不止可以用来读取文件,还可以和RCE,XXE,反序列化等进行组合利用 filter协议介绍 php://filter是php独有的一种协议,它是一种过滤器,可以作为一个中…

微信小程序开发中,请求数据列表,第一次请求10条,滑动到最低自动再请求10条,后面请求的10条怎么加到第一次请求的10条后面?

在微信小程序中实现分页加载数据列表,可通过以下步骤将后续请求的10条数据追加到首次加载的数据之后: 实现步骤及代码示例 定义页面数据与参数 在页面的 data 中初始化存储列表、页码、加载状态及是否有更多数据的标识: Page({data: {list…

如何利用 Java 爬虫根据 ID 获取某手商品详情:实战指南

在电商领域,获取商品详情数据对于市场分析、选品上架、库存管理和价格策略制定等方面具有重要价值。某手作为国内知名的电商平台,提供了丰富的商品资源。通过 Java 爬虫技术,我们可以高效地根据商品 ID 获取某手商品的详细信息。本文将详细介…

电平匹配电路

1、为什么要电平匹配? 现在很多SOC器件为了降低功耗,都把IO口的电平设计成了1.8V,核电压0.85V,当这种SOC做主平台时,在做接口设计需要格外关注电平的匹配。单板中经常需要将1.8V的电平转换成3.3V或者转成5V。如果没有注意到输入和输出信号之间的电平匹配,系统就无法正常…

【技术揭秘】Profinet转RS485如何优化冲剪机的实时通信性能?​​

在现代工业自动化领域,通信协议是连接不同设备和系统的关键。RS485和Profinet是两种广泛使用的工业通信标准,它们各自拥有独特的特性和应用场景。本文将探讨如何通过一个小疆智控Profinet转RS485网关来优化冲剪机的应用,提高生产线的效率和可…