最近读完了一本关于 AI Engineering 的书,说实话,这是我开年读过最值得推荐的 AI 相关书籍之一。
如果你和我一样,不是 AI 研究员,也不是机器学习专家,但每天都在和 LLM、Copilot、ChatGPT、RAG、Prompt 打交道,那这本书很可能正好写给你。
它不试图把你培养成一个机器学习工程师,而是站在软件工程师、技术负责人、产品与工程交叉角色的视角,系统地回答一个更现实的问题——当 AI 成为基础能力,我们到底该如何工程化地使用它?
1
不是机器学习教材,而是 AI 工程指南
先说清楚一件事,这不是一本 ML 入门书。如果你指望从中学到反向传播、损失函数推导、模型训练细节,那你大概率会失望。
但如果你的目标是:理解基础模型(Foundational Models)是如何被使用的;知道采样(sampling)、模型评估、模型安全在工程里意味着什么;明白 Prompt Engineering、Dataset Engineering、RAG、Fine-tuning 各自解决什么问题;或者是搞清楚为什么 AI 会幻觉、什么时候不该相信它。
那这本书的定位就非常准确!书里讲得最多的不是怎么训练模型,而是在真实的系统里,如何让 AI 变得可用、可控、可评估。这也是我认为它特别适合软件工程师的原因。
2
Prompt 工程不是岗位,是必备能力
书中对 Prompt Engineering 和 Sampling 的讲解非常实用。作者并没有神话提示工程师这个概念,而是很务实地指出:
Prompt 是接口设计
采样策略会直接影响系统行为
好的 prompt 能显著降低幻觉,但永远无法彻底消除。
这几点我是非常认同的。Prompt Engineering 不是一个职业,但一定是一项值得掌握的工程能力。只是,它永远不该被当成构建生产系统的全部。
RAG、Fine-tuning 这些技术,书里也有介绍。作者讲清楚了它们是什么、什么时候用,但并没有给你一种照着做就能上线的错觉,这一点反而让我觉得很诚实。
3
作者没有刻意回避 AI 的局限
这本书有一个我非常喜欢的地方,它没有回避 AI 的问题,反而把问题摆在了台面上。
上下文为王
这句话从未像现在这样真实。为 LLM 提供清晰、详尽的上下文至关重要。但事情并不简单,上下文越长,模型就越有可能把注意力放在错误的部分上。
此外,LLM 更擅长执行出现在提示开头或结尾的指令,而不是中间部分,这就是位置偏差(position bias)。有一种提示技巧是:在用户输入之后重复一遍最初的指令。我原以为只有小孩才容易只记住最后听到的东西。
学得越多,反而觉得自己知道得越少
这当然可能是因为信息量过大让人应接不暇,但我们也确实会遗忘。别担心,你并不孤单——我们的 LLM 朋友也一样。模型学会的任务越多,就越容易出现灾难性遗忘(catastrophic forgetting),也就是说,它在早期任务上的表现会明显下降。这或许能解释为什么我现在已经不太会解二次方程了。也许我也是个 LLM。
好吧,我大概不是 LLM
不过,人们已经开始担心:用于训练 LLM 的内容可能会不够用了。确实,LLM消耗公开信息的速度已经超过了新内容的产生速度。
于是,合成数据(synthetic data,即 AI 自己生成的数据)被越来越多地用于训练模型,只要谨慎使用,它确实有帮助。但问题在于,合成数据只是模仿真实数据,因此得到的性能可能是表面的。
一个用其他模型生成的合成数据训练出来的模型,也许能直接给出答案,却未必真正理解为什么或怎么来的。但你千万别指望它会轻易承认自己不懂——如果你追问解释,它很可能会编一个幻觉出来。
这让我想起《黑天鹅》里提到的一个实验:让裂脑病人的一个大脑半球执行某个动作,然后再让另一个半球解释原因,病人往往会编出一个毫无意义的解释。总之,一些研究已经发现,合成数据的使用与模型性能下降存在相关性。我敢打赌,这样训练出来的代码库一定“非常精彩”。
理解 AI 能做什么、不能做什么,以及它的影响和限制,非常重要。这本书在这一点上解释得相当扎实。而这些限制,也正好引出了 AI 在软件开发中面临的更大问题。
众所周知,AI 本质上是概率性的。你见过那张概率很低,但永远不为零的梗图吗?这几乎就是 AI 的座右铭!只要概率不为零,不管多离谱,AI 都有可能生成出来。
4
对 AI 取代程序员的一些冷静的看法
作者本身并没有煽动程序员将被取代,但它间接解释了为什么这种说法经不起推敲。
我自己的结论是:AI 很擅长样板代码、局部算法、重复劳动,但是 AI 非常不擅长领域建模、架构权衡、质量判断。好代码仍然需要思考、经验和创造力。
如果你指望 AI 帮你设计一个合理的领域模型,那大概率会收获一堆看起来像对的错误代码。AI 放大能力,但前提是你本身得有判断力。
5
为什么强烈推荐这本书
总结一下,这本书特别适合:
软件工程师 / 架构师 / Tech Lead
正在把 AI 引入真实业务的人
不想被营销话术洗脑、想看清 AI 工程本质的人
它不会让你马上变成 AI 专家,但会帮你建立一个非常重要的能力,知道 AI 能做什么,不能做什么,以及什么时候不该用它。我认为这是当下比多会几个 prompt 技巧更重要的事情。
但如果你想在喧嚣的 AI 叙事之外,找一本足够冷静、足够工程化、也足够现实的书,那我会非常愿意推荐你读一读它。
AI 有多有用,取决于使用它的人。而这本书,至少能让你成为一个更清醒的使用者。
《AI 工程》抢读版抢先上市!纸质版+电子版,一次付费两种体验。速速扫码加购吧~👇