为什么你跟AI说话它总是听不懂?12000星项目揭秘答案

加我进AI讨论学习群,公众号右下角“联系方式”

文末有老金的开源知识库地址·全免费


你有没有这种经历?

跟AI说"帮我写个文案",它给你一堆废话。

跟AI说"帮我分析数据",它分析得牛头不对马嘴。

让AI帮你写代码,结果跑都跑不通。

你以为是AI太笨?

不,是你说得太少。

昨儿刷GitHub,老金我发现一个神奇的现象:

一个叫context-engineering-intro的仓库,半年时间冲到了12000星。

作者是Cole Medin,生成式AI领域的老炮儿。

他在README里写了一句话,直接把老金我看愣了:

"Context Engineering is 10x better than prompt engineering and 100x better than vibe coding."

翻译:上下文工程比提示词工程强10倍,比Vibe Coding强100倍。

卧槽,这口气够大的。

但MIT Technology Review都专门写了篇文章报道这个趋势。

先科普一下:什么是Vibe Coding?

2025年2月,Andrej Karpathy(OpenAI联合创始人、特斯拉前AI总监)发了条推,提出了一个概念:

Vibe Coding(氛围编程)。

什么意思?

就是用自然语言描述需求,让AI帮你写代码。

比如你跟Claude说:"帮我做一个追踪每日习惯的网页应用,要有趣味性,像游戏一样。"

然后AI就帮你把代码全写出来了。

不用一行行敲,全靠"感觉"。

这玩意儿火了大半年,各种工具都在蹭这个概念。

但问题来了:很多人发现,AI写的代码经常翻车。

要么逻辑错了,要么风格乱了,要么根本跑不通。

为什么?

核心问题:AI失败不是模型笨,是你说得太少

Cole Medin在项目里说了一句话,老金我觉得特别到位:

"大多数AI失败,不是模型问题,是上下文问题。"

啥意思?打个比方:

你跟一个新来的实习生说:"帮我做个登录功能。"

实习生懵了:

1、用户名密码登录?还是手机验证码?还是微信扫码?

2、登录成功后跳转到哪个页面?

3、密码错了提示什么?错几次锁账号?

4、页面长什么样?有没有参考图?

你不说清楚,他只能瞎猜。猜对了算运气好,猜错了就得返工。

AI也是一样。

你随便说一句"帮我写个登录功能",AI也不知道你具体想要什么。

它又不是你肚子里的蛔虫。

这就是Vibe Coding的致命缺陷:说得太随意,AI只能猜。

上下文工程是什么?

Cole Medin提出的解决方案叫Context Engineering(上下文工程)。

核心理念:

不是给AI写一张便利贴,而是给AI写一部完整的剧本。

什么意思?

提示词工程(Prompt Engineering):

1、想办法把话说得更巧妙

2、类似给AI递一张便利贴

3、"帮我写个登录功能,要安全一点"

上下文工程(Context Engineering):

1、给AI提供完整的上下文系统

2、包括文档、示例、规则、模式、验证标准

3、类似给AI一部完整的剧本,角色、台词、场景、道具全都有

一句话总结:Vibe Coding靠感觉,上下文工程靠系统。

Cole Medin的方法论:三份说明书

研究了这个项目,老金我发现他的方法论其实很简单。

核心就是:给AI准备三份"说明书"。

先看看文件怎么放

别怕,结构很简单,一看就懂:

你的项目文件夹/ ├── CLAUDE.md ← 说明书1:项目规矩本(放在根目录) ├── INITIAL.md ← 说明书2:需求详情单(放在根目录) ├── examples/ ← 参考代码文件夹 │ └── 好代码示例.py ← 你觉得写得好的代码放这里 ├── PRPs/ ← 执行计划文件夹 │ └── 功能A.md ← 说明书3:AI生成的执行清单 └── .claude/ ← Claude专用设置文件夹 └── commands/ ← 快捷命令 ├── generate-prp.md ← 一键生成执行清单 └── execute-prp.md ← 一键执行计划

就这么简单:根目录放两个md文件,建两个文件夹。5分钟搞定。

说明书1:项目规矩本(CLAUDE.md)

这是一个放在项目里的文本文件,告诉AI:

"这个项目的规矩是什么。"

比如:

1、代码要简洁,一个文件不能超过300行

2、变量命名用小写加下划线,比如 user_name

3、每个功能都要写测试

4、注释用中文写

AI每次干活之前都会先看这份"规矩本",就不会乱来了。

类比:就像新员工入职,先给一本《员工手册》,告诉他公司规矩。

说明书2:需求详情单(INITIAL.md)

这是你告诉AI"我想要什么"的文件。

但不是随便说两句,而是写清楚四个方面:

1、要做什么功能

不要写"帮我做个爬虫"。

要写"帮我做一个自动抓取淘宝商品价格的工具,每天早上8点运行,把结果存到Excel表格"。

2、有没有参考样例

给AI看几个你觉得写得好的代码文件。

告诉它"按这个风格来"。

3、相关资料

比如你要用到某个工具,把那个工具的说明文档链接贴上。

4、特别注意事项

比如"淘宝有反爬机制,要注意频率控制"。

类比:就像跟装修师傅交底,不是说"帮我装修一下",而是给图纸、给参考照片、告诉他你的预算和特殊要求。

说明书3:执行清单(PRP)

PRP就是"产品需求提示词"。

它是根据前两份说明书,自动生成的一份详细执行计划。

包括:

1、第一步做什么,第二步做什么

2、每一步完成后怎么验证对不对

3、可能遇到什么问题,怎么处理

有了这份清单,AI就像一个拿到详细任务书的员工,一步步照着做就行。

类比:就像菜谱,不只告诉你"做红烧肉",而是告诉你放多少糖、多少酱油、炖多少分钟。

如果对你有帮助,记得关注一波~

为什么这玩意儿有效?

老金我测试了一周,发现上下文工程确实比Vibe Coding靠谱多了。

原因1:消除猜测

你把所有信息都给AI了,它不用猜。

代码风格?文档里写了。

测试规范?文档里写了。

边界情况?文档里写了。

AI只需要照着做就行。

原因2:自我修正

PRP里有验证环节。

AI写完代码会自己跑测试,有问题自己修。

不像Vibe Coding,写完就完了,错了还得你来改。

原因3:可复制

一套上下文系统,整个团队都能用。

新人来了,不用手把手教,AI照着上下文就能产出一致的代码。

老金实测对比

测试场景:让AI帮我写一个数据分析功能

Vibe Coding方式(随便说两句)

我跟AI说:"帮我做一个分析用户数据的功能"

结果翻车了:

1、AI用的技术框架跟我项目里的不一样(就像你家用的是苹果手机,它给你配了个安卓充电器)

2、代码风格跟我现有的代码完全不搭

3、没有处理"万一出错了怎么办"

4、没有测试代码

返工时间:2小时

上下文工程方式(给足信息)

1、在"规矩本"里写清楚:我用的是什么技术框架

2、在"需求详情单"里详细描述要做什么、有什么特殊情况

3、在examples文件夹里放了几个我觉得写得好的代码文件,告诉AI"按这个风格来"

4、让AI根据这些信息,自动生成一份详细的执行计划

5、然后照着计划一步步做

结果:

1、代码风格完全一致(跟我现有代码一个味儿)

2、各种意外情况都考虑到了

3、测试全部通过

返工时间:0

结论:前期多花30分钟准备上下文,后期省2小时返工。这笔账,划算!

老金建议

研究完这个项目,老金我有几点感悟:

1. 上下文比模型重要

很多人觉得AI不行,第一反应是换个更贵的模型。

其实大多数时候不是模型的问题,是你给的信息不够。

便宜模型 + 好上下文 > 贵模型 + 烂上下文

就像给一个聪明人模糊的指令,不如给一个普通人详细的说明书。

2. CLAUDE.md是基础

如果你还没有给项目写CLAUDE.md,赶紧写。

这个文件是上下文工程的地基。

3. examples/文件夹很关键

AI看示例比看文档学得快。

在examples/放几个代码示例,告诉AI"按这个来",效果比写一堆规则强。

4. 不要迷信Vibe Coding

Vibe Coding适合原型、简单脚本。

但真正的生产级代码,需要上下文工程。

给你们的行动建议:

1、去GitHub搜context-engineering-intro,下载下来研究(这个项目12000多人收藏,质量有保证)

2、给你的项目写一个CLAUDE.md文件,把项目规矩写清楚

3、建一个examples文件夹,放上你认为写得好的代码当参考

4、下次让AI写代码前,先问自己:我给的信息够不够详细?

老金说

从Vibe Coding到上下文工程,老金我看到的是一个规律:

任何技术,从"随意玩玩"到"正经用",都需要系统化。

2025年年初,大家觉得Vibe Coding够酷了——随便说两句话,AI就把代码写出来。

但用了半年发现,"随便说两句"经常翻车。

于是有人开始琢磨:怎么让AI更稳定?

答案就是:给它更多上下文。

这个道理其实放在哪儿都成立。

你跟一个新同事说"帮我做个登录功能",他也得问你一堆问题。

用什么框架?什么风格?参考哪个模块?

你不说清楚,他也得猜。猜错了,也得返工。

AI也是一样。

它不是神仙,猜不透你心里想什么。

你想让它干活干得好,就得把话说清楚。

不是一张便利贴,是一部完整的剧本。

这就是上下文工程的本质:

把你脑子里的东西,系统地表达出来。

说起来简单,做起来需要练习。

但一旦养成习惯,你会发现:AI真的能成为靠谱的搭档。

老金我现在每次开新项目,第一件事就是写CLAUDE.md。

不是为了显得专业,是真的省时间。

前期多花半小时,后期省几个小时返工。

这笔账,划算。

你们觉得呢?Vibe Coding和上下文工程,你更倾向哪个?

评论区聊聊!

参考来源

  • Cole Medin的GitHub项目:github.com/coleam00/context-engineering-intro
  • MIT Technology Review报道:technologyreview.com/2025/11/05/1127477/from-vibe-coding-to-context-engineering-2025-in-software-development/
  • Medium深度解析:uditgoenka.medium.com/context-engineering-7713c5b7eccc

往期推荐:

提示词工工程(Prompt Engineering)

LLMOPS(大语言模运维平台)

WX机器人教程列表

AI绘画教程列表

AI编程教程列表


谢谢你读我的文章。

如果觉得不错,随手点个赞、在看、转发三连吧🙂

如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。

开源知识库地址:https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1119287.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习毕设选题推荐:人工智能基于python深度学习的砖头墙裂缝识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

【计算机毕业设计案例】基于卷神经网络的训练形状识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

【SQLSERVER】 Page life expectancy计数器参数解析

SQL Server 中 SQLServer:Buffer Manager​ 和 SQLServer:Buffer Node​ 这两个对象下有相同计数器 Page life expectancy ,要区分两个对象的参数含义,需从作用范围、架构背景、分析场景三个维度理解:1. 核心区别:作用范围与架构…

Python+Vue的美容院管理系统 Pycharm django flask

这里写目录标题项目介绍项目展示详细视频演示技术栈文章下方名片联系我即可~解决的思路开发技术介绍性能/安全/负载方面python语言Django框架介绍技术路线关键代码详细视频演示收藏关注不迷路!!需要的小伙伴可以发链接或者截图给我 项目介绍 传统的美容…

【计算机毕业设计案例】卷神经网络基于python深度学习的砖头墙裂缝识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026想布局大模型推理工程师?一定要看这份核心能力架构图:系统掌握7大技术维度与高阶拓展方向(含实战解析)

大模型推理工程师的工作核心是推动大模型从实验室走向产业应用,既要扎根技术理论,又要深耕工程实践,是一个兼具专业深度与技术广度的复合型岗位。以下从核心能力与拓展维度,解析该岗位所需的关键素养: 一、核心编程语…

艾体宝案例 | 从关系到语义:ArangoDB如何支撑高精度水军识别

数字社交生态的繁荣,伴随着用户生成内容的爆炸式增长,也让水军乱象成为平台治理的顽疾。水军账号通过批量操作制造虚假热度、扩散不实信息,不仅扭曲正常信息传播秩序,还会侵蚀平台公信力、损害用户的真实体验。在应对这一挑战时&a…

2026都到了!为什么说AI产品经理是未来5年最值得all in的岗位?

如果你要问我:未来5年,什么岗位最有“钱”景、最值得all in? 我的答案只有一个——AI产品经理。 这不是我瞎说。过去一年,我跟超过200位职场人聊过这个话题。我发现,几乎所有想抓住AI机会的人,都卡在了这3种…

大模型技术体系全攻略:AIGC(单/多模态)、RAG技术、Function Calling、智能体Agent及MCP协议!

简介 文章系统介绍了大模型技术体系,包括AIGC(单/多模态)、RAG技术、Function Calling、智能体Agent及MCP协议。AIGC解决内容生成,RAG增强实时信息获取,Function Calling赋予工具调用能力,Agent实现任务闭环,MCP提供统…

【课程设计/毕业设计】基于深度学习的砖头墙裂缝识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

PostIn速成手册(11) - 使用自动化接口测试全方位确保接口质量

PostIn是一款开源免费的接口管理工具,支持免费私有化部署,一键安装零配置,页面设计简洁易用。本文将介绍如何编写接口用例并进行全面测试。1、接口用例PostIn支持如下几种测试用例。接口单元用例:针对单个接口的输入输出进行验证&…

从入门到落地:MindSpore实战指南与经验总结

MindSpore是华为自研全场景AI框架,覆盖开发、训练、部署全链路,适配多领域需求,助力新手入门与资深开发者落地项目。本文精简提炼入门准备、核心实操、模型部署、性能优化、问题排查五大模块的实战要点,帮助开发者快速上手、少走弯…

最新版最详细Anaconda新手安装+配置+环境创建教程

Anaconda 新手安装 配置 环境创建教程(最新版,基于 2026 年信息) Anaconda 是一个开源的 Python 和 R 发行版,专为数据科学、机器学习和科学计算设计。它包含了 conda 包管理器、数百个预装包(如 NumPy、Pandas、Ma…

【数据分享】全国村级行政区矢量(免费/无套路分享)

行政区划边界矢量数据是我们在各项研究中最常用的数据。本次我们为大家带来的是我国分省的行政村(社区)的行政区划矢量数据!数据格式为Shp,每一个省份的行政村(社区)行政区划数据保存为一个shp文件。数据范…

大模型应用开发者的核心必修课:深入拆解提示词工程的技术原理、评估体系与优化框架

“ 提示词工程是用户与大模型交流的桥梁,提示词的好坏直接影响到模型的效果。” 在大模型应用开发中,所有的操作最终的结果都是拼接成提示词输入给大模型,因此可以说提示词是大模型应用的核心。 因此,而诞生了一项叫做提示词工程的…

MindSpore开发之路:训练可视化:使用MindInsight洞察模型行为

模型的网络结构真的如我所想的那样搭建的吗?Loss曲线的详细变化趋势是怎样的?是否存在剧烈震荡?模型中每一层权重参数在训练过程中的分布和变化情况如何?是否存在梯度消失或梯度爆炸的迹象? 要回答这些问题&#xff0…

深度学习毕设项目推荐-基于python深度学习的砖头墙裂缝识别卷神经网络

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

HTTP报文详解

HTTP 报文详解 HTTP(Hypertext Transfer Protocol,超文本传输协议)是 Web 通信的基础协议,用于客户端(如浏览器)和服务器之间交换数据。HTTP 报文 是 HTTP 协议交互的信息载体,分为两种类型&am…

MindSpore开发之路:静态图 vs. 动态图:掌握MindSpore的两种执行模式

在使用MindSpore的过程中,我们几乎在每个脚本的开头都会写下一行代码:context.set_context(mode...)。这行代码的作用是设置MindSpore的执行模式。这是一个非常核心的设置,它从根本上决定了你的代码是如何被框架解释和执行的,直接…

Attention机制完全揭秘:轻松解决长文本处理难题!

简介 文章首先介绍了Attention机制如何解决RNN处理长序列的瓶颈问题,详细解释了其实现原理、不同类型(Soft/Hard,Global/Local)及代码实现。同时提供了AI大模型的完整学习路径,从系统设计到微调开发七个阶段&#xff0…