规范驱动研发的几点思考

news/2026/1/24 13:25:36/文章来源:https://www.cnblogs.com/tlnshuju/p/19526047

规范驱动研发的几点思考

2026-01-24 13:22  tlnshuju  阅读(0)  评论(0)    收藏  举报

摘要

2025年,AI编程工具经历了从狂热到理性的深刻演变。本文基于一线实践,系统梳理了AI辅助编程的核心范式演进——从依赖模糊描述的“氛围编程”,走向以规范驱动创建(SpecDD)为核心的严谨方法。本文基于规范驱动创建,提出了优化规范驱动开发的几点措施:统一领域语言验收测试驱动存量业务理解,并深入分析了在团队中落地的四大难点与五项策略。我们正站在开发范式转变的关键节点,而这次变革的核心,是让人与AI在各司其职中协同创造更大价值。

引言

2025年是AI一日千里的一年。年初,DeepSeek 大火,紧接着 Andrej Karpathy 带火 Vibe Coding,然后上下文工程、MCP、Workflow和Agent之争,从Cursor、Windsurf到Claude Code、kiro、trae等AI IDE你方唱罢我登场,但核心问题愈发清晰:如何系统化地利用AI提升软件工程效能?当前给出的答案是规范驱动开发(SDD)

在阅读Martin Fowler关于软件工程演进的一篇采访后,我深感共鸣。我们正面临与昔日面向对象、敏捷、微服务等变革相似的前沿场景。以下是我的几点思考。

规范驱动研发的几点思考

如今,规范驱动开发(Specification-Driven Development, SDD)大火,对于如何落地规范驱动开发,个人觉得如何加上如下三点之后,效果会更佳。

1. 需求拆解与AI能力评估

SWE-Bench Multilingua

不同的。就是尽管 AI 发展一日千里,不过,它不是万能的,上图是 SWE-bench Multilingual 在不同语言的解决率,很容易发现  Rust、Java、Python的效果要显著好于C/C++。同样,即使是 Java 语言的功能,在实现不同功能时,AI的效果也

比如,框架代码、工具类用方便的ChatGPT、Qwen2.5 32B 模型就能解决,但是,你如果要实现具体的业务效果,那么,必须得 Qwen3-Coder-480B。因此,作为程序员,要求具备两个新能力

1、准确评估AI 能力:能准确评估哪些功能使用 AI,哪些需要自己亲自操刀

2、需求拆解能力:模型的上下文是有限的,因此,不能把需求一股脑给 AI,需要将需求拆分为合适的粒度

当你具备着两个能力的时候,你的能力在AI 时代将得到成倍的放大

讲这个点是,大家产品线的 AI IDE能力在 10 月份有一个非常大的能力提升,之前基于 workflow+qwen2.5 32B的模型,简单说就是只能达成基本的 CRUD,稍微加点业务就不行,一个不到 200 行代码,我花了一个下午验证,末了,通过对需求增加了更多详细的约束之后,基本一次能相对生成 80%的代码直接可用,于是,我们针对业务梳理了各种典型的开发场景,评估哪些场景可以使用 AI。而到了10月份底,重新基于Agent+Qwen3-Coder-480B实现之后,能力出现了一个很大的飞跃,同事利用周末一天开发了 3k 的代码,而全程几乎没有人工写代码,仅仅改了配置。

2 面向AI的领域统一语言

图片

结构:若是你的代码能满足金字塔原理,那么,你的代码一定不会差。

词汇表:运用过 AI 的人都知道,其实大多数场景自然正常表达即可,涉及存量手段调用,尽量用技巧名英文单词替代中文。核心一个要领,言简意赅

技巧抽象,比如你实现一个订单付款的方法,你直接说调用payxxx办法,大模型通过上下文工程自动会封装对应的业务。就是声明式表达:想法来自Kubernets和函数式编程,你不需要详细描述每一步,比如,你直接说快排,模型就能理解。业务中如何抽象某种业务操作,核心就

对于企业内部特有的领域逻辑,应对策略是:新增业务功能,封装为函数;存量功能,描述其名称即可

比如,调用已经存在的一个业务功能,不需要详细给出参数,只需要说类名和方法名即可,如果方法是唯一的,给方法名即可,AI 可以通过你描述的关键词准确找的对应代码位置,自动将代码的参数、返回值添加到上下文。

注:此种子语言依赖大模型上下文工程对存量代码的理解程度。比如,底层同样的模型,我用qwen cli时,需求就应该比用Claude Code描述得更详细才行,所谓能力不够,描述来凑。

否存在一种更抽象语言来编程?看到Martin Fowler的采访之后,第一次感觉和大牛同频了,才有了此文。就是统一语言的事情,是 24 年的时候我就在思考这个事情,记得公司的 ICT 软件技术大会结束后,软件总工邀请了徐昊老师进行线下交流,我当时问了两个障碍,其中一个就是

3. 验收测试驱动开发(AI-ATDD)

当为AI提供具体的验收测试用例时,AI会具备多轮自我迭代与优化的能力,大幅减少人工干预轮次。此种能力能达成的核心是Claude Code在生成代码的时候,自动会生成测试用例和代码(依赖具体的模型,我用的后台模型是 GLM 4.6),不过由于有时候它不能理解大家的环境,有时候命令不可运行,测试失败了,大部分情况下,我们选择忽略,而当把测试的方法告诉它之后,它就会严格按照我给的用例进行迭代。

这个想法来源是,我最近用Claude Code实现一个“合并连续编号文件”的机制。在没有提供测试用例时,Claude Code生成的初版代码不正确,我需要通过多轮交互、反复澄清需求才能修正。而当我在需求中附上了简单的输入输出示例后,AI在生成代码后,自动以其为基准进行验证,首次失败后自我反思,在第三次迭代即成功通过用例。

如下示例

遍历文件夹,找的所有的.md文件,取文件名的第一个数字,进行排序;排序之后,取文件
名中的第二个数字,如果数字连续,就将相邻的文档合并。验证:输入
test/xuexijuexing/,存在
xuexijuexing10_6_selector_1_0.md,xuexijuexing11_2_selector_1_0.md,xuexijuexing
12_3_selector_1_0.md,xuexijuexing13_4_selector_1_0.md,xuexijuexing9_5_selector
_1_0.md,合并xuexijuexing9_5_selector_1_0.md,xuexijuexing10_6_selector_1_0.md为
xuexijuexing9_5_selector_1_0.md,合并xuexijuexing11_2_selector_1_0.md,xuexijuex
ing12_3_selector_1_0.md,xuexijuexing13_4_selector_1_0.md
为xuexijuexing11_2_selector_1_0.md   首先排序

通过预先提供验收用例,将调试与澄清的成本从“人-AI多轮对话”转移给“AI自我迭代”,极大提升了首次生成的成功率与整体效率。

还有就是B 站的一个视频,关于 SWE-Bench发展趋势的图,即使 SWE-Bench不能代表编码的能力,但已经能说明一些问题

图片

综合起来,在 SDD 的基础上,行叠加如下能力能获得更好的效果

1、需求拆分为功能点

2、面向AI的领域统一语言

3、增加必要的验收用例

如何落地

图片

难点 1:人员惯性

哪怕年初DeepSeek 在全国范围已经出圈,如果你关注 AI 相关的自媒体,每天看到的都是颠覆,而现实是,只有 10%的开发人员在持续利用 AI 辅助编码,90% 的开发人员只是偶尔用于,

但是,即使 AI 可能胜任,90%的人也不会使用,为什么?这就是埃弗雷特·罗杰斯的创新扩散理论曲线的厉害之处

以我推广AI在团队的运营经验,在一个人均 211 的公司,50%以上的人根本没有改变的意愿,很多人你不管怎么宣传他也从不会主动使用,这就是事实,更不用说其他公司了。大部分人对 AI 的理解仍然停留在年初的DeepSeek,仍然在网页上通过 AI 生成一些简便的工具类,假如你经常运用 Cursor 或 Claude Code等 AI IDE解决你的各种开发问题,你已经属于早期采纳者了。

难点 2:范式转移

程序员要从写具体的代码转变为写准确的文档、软件设计、设计测试用例,这与之前的习惯和要求的技能树发生了变化。据我接触的情况来看,大部分程序员描述需求的能力一般般,必须经过必要的培训才行。

写文档vs写代码:要求开发人员写代码改为写文档,是逆人性的。因为以前写完代码,再补充文档,大家觉得没挑战,现在要从有挑战的写代码改成写文档,很难接受。

有人觉得是解放:我以为我真的很喜欢写代码,结果发现,我喜欢的其实是写代码能带来的东西。

有人则有些怀念:整天提示 Claude 并不那么有趣或有成就感。自己戴上耳机、进入心流状态、亲手建立一个东西,那种感觉要好多了。

有人悲喜交加:我不止听到一位同事说,常常使用 AI IDE,发现自己不想手写代码了,他们既有不用手写代码的兴奋,也有自己技能退化的担忧,这么持续下去,会不会不会写代码了

还有人直接接受了该 trade-off:确实有些东西我会怀念——比如重构代码时进入那种禅定般的心流状态。但我现在生产力高了太多,这点代价我愿意付

难点 3:错误容忍度

不同的人对错误的容忍度不一样,有些人源于1-2 次AI 效果不达预期,就不愿意再尝试。而有些人,对AI 效果不达预期的容忍度要高很多。比如,竟然有人因为 AI 生成的注释中时间不对,觉得 AI 不行,拿着 AI 解决不了某个智力疑问来评测 AI 的能力!思维还停留在质疑AI的能力上,而不是欣然接受不确定性

难点 4:担心AI 替代

当 AI 介入之后,效率提升,原有工作量必然被压缩,同样的需求,人力必然被压缩,必然面临裁员。但趋势已无法改变,唯有拥抱变化,拥抱变化说起来容易,做起来难。从多方面想信息来看,本轮 AI 只能解决编码的问题,不能解决软件工程的问题。所以,大可不必担心,尽快专注到业务、设计等高价值的事情

那么,如何在团队中落地呢?除了对 AI能力的宣传之外,

1、流程优化

  • 流程的变革就是一种方式,比如,在团队集中澄清需求的时候,每个程序员写的设计文档必须是AI 友好的。比如,需求拆分为机制、采用统一的描述语言、添加必要的验证用例等。

  • 在代码提交环节,依据预提交钩子(pre-commit hook)进行卡点,对AI高胜任度的任务(如框架类、生成工具类等 100 行以上的代码),检查是否合理使用了AI辅助。

2、梳理 AI 胜任矩阵:团队共同维护一份动态更新的清单,明确列出当前已验证的、AI能高质量完成的场景。这为开发者提供了清晰的使用指南,降低了试错成本。

3、宣传好的案例:定期分享内部成功的、提效显著的AI应用案例,用实实在在的结果刷新团队认知,证明AI在困难场景下的能力。

4、技能培训与激励:组织关于“如何编写优质AI提示词”、“SDD文档编写规范”的培训。将AI应用的有效使用纳入绩效考核或贡献度表彰体系。

5、文化引导:坦诚讨论AI带来的变化,强调未来的核心价值在于“业务设计、架构决策与复杂问题解决”解放开发者专注于此的利器。就是,而AI

总结与展望

回顾软件工程发展史,每一次范式转移——面向对象、敏捷、TDD、微服务——都源于对前沿工程挑战的深刻回应。今天,我们正站在AI重构软件开发流程的起点。

Martin Fowler在采访中谈及技术变革的本质,与我实践中的感悟不谋而合:真正的进步,不在于工具本身,而在于我们如何重新定义角色、流程与协作方式。规范驱动编写(SDD)、统一语言、验收测试驱动,正是我们为这一新协作模式奠定的基石。

这不仅仅是效率的量变。它要求大家从“代码编写者”转变为蓝图设计者、质量定义者与AI训练师。确实,我们或许会怀念亲手编码时进入的心流状态,但换来的,是驾驭更复杂系统、创造更大业务价值的可能性。这个代价,值得付出。

改变已至,唯拥抱者先行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1209862.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年值得关注的油脂分离器厂家推荐

油脂分离器作为餐饮、食品加工、酒店等行业废水处理的关键设备,其性能直接关系到水质达标排放与生态环境保护。随着《水污染防治行动计划》等环保政策的持续推进,市场对高效、稳定的油脂分离设备需求显著增长。当前,…

2026进口油脂分离器品牌推荐及行业应用参考

进口油脂分离器作为餐饮、食品加工、酒店、食堂等行业废水处理的关键设备,通过物理沉淀、离心分离等技术手段,有效分离废水中的动植物油脂及固体杂质,不仅能防止管道堵塞、降低污水处理设施运行负荷,还能减少环境污…

2026商业广场线性排水沟推荐:选型要点与高效方案解析

商业广场作为城市人流密集的公共空间,其排水系统的可靠性直接关系到行人安全、场地使用效率及整体环境质量。线性排水沟作为商业广场排水体系的核心组成部分,承担着快速排除地表雨水、防止积水、保障通行安全的重要功…

2026市政道路树脂线性排水沟推荐及选型参考

市政道路排水系统是城市基础设施的重要组成部分,直接关系到道路通行安全、城市内涝防治及生态环境维护。树脂线性排水沟作为近年来市政工程中广泛应用的新型排水设施,凭借其独特的材料特性与结构设计,在排水效率、耐…

接口通讯学习(day06):串行通信核心标准深度解析:UART、RS-232、RS-422与RS-485 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【品牌出海】店铺乱得像“杂货铺”?揭秘 AI 如何批量统一图片风格,3 秒打造国际大牌感!

Python 品牌建设 图片翻译 视觉规范 亚马逊品牌化 跨境电商 Listing优化 摘要 在跨境电商从“铺货”向“品牌化”转型的今天,视觉一致性(Visual Consistency) 是品牌溢价的核心来源。然而,大多数卖家面临的尴尬是:货源…

使用conda创建的虚拟环境在哪个文件下

当使用 conda 创建虚拟环境(如py312)时,环境文件默认存储在 Anaconda 或 Miniconda 的安装目录下的envs文件夹中。具体路径取决于操作系统和安装位置: 1. 默认存储路径 Windows: C:\Users\你的用户名\anaconda3\envs\py312 (若安装在其他位置,替换C:\Users\你的用户名\…

如何使用CONDA创建python 3.12虚拟环境

使用 conda 创建 Python 3.12 虚拟环境的步骤如下: 1. 确认 Anaconda/Miniconda 已安装 确保你的系统已安装 Anaconda 或 Miniconda。若未安装,可从官网下载: Anaconda:Download Anaconda Distribution | Anaconda Miniconda:https://docs.conda.io/en/latest/miniconda…

启动Docker中DIFY或者Ragflow的命令

启动DIFY的命令: 参数详解 docker compose -f docker-compose-gpu.yml -p docker-dify up -d-f docker-compose-gpu.yml 作用:指定使用的 Compose 配置文件路径。 说明:Dify 通常提供多个配置文件,docker-compose-gpu.yml 专为需要 GPU 加速的场景优化(如大模型推理),…

Python中的强大时间序列预测工具:Facebook Prophet

在数据科学和机器学习领域,时间序列预测是一项常见且重要的任务,广泛应用于销售预测、库存管理、金融分析、流量监控等场景。然而,传统的时间序列模型(如ARIMA、指数平滑)往往对数据平稳性要求高、调参复杂&#xff0c…

达梦(DM) vs Vastbase 完整对比报告

目录 达梦(DM) vs Vastbase 完整对比报告执行摘要一、环境配置对比二、架构对比2.1 容器架构2.2 集群模式对比2.3 架构图示 三、高可用(HA)对比3.1 HA机制对比3.2 服务发现配置 四、性能配置对比4.1 内存配置4.2 连接配置4.3 性能特性 五、数据类型对比5.1 标准SQL类型5.2 特色…

完整教程:WSL子系统(Ubuntu)安装Docker

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2026年盐城中考复读个性化机构推荐,鸿文学校分层教学提升

在教育多元化发展的当下,中考复读成为许多不甘于现有成绩、渴望冲刺理想高中的学生的重要选择。面对市场上良莠不齐的中考复读机构,如何挑选一家资质正规、教学专业、口碑过硬的学校,成为家长和学生的核心关切。以下…

讲讲超高分子量聚乙烯板创新制造商怎么收费

2026年工业制造领域持续向高效化、低损耗转型,超高分子量聚乙烯板作为耐磨抗腐领域的核心材料,已成为煤矿、冶金、化工等行业解决输料痛点、降低运营成本的关键支撑。无论是定制化耐磨衬板的研发、全链条安装服务的落…

膨胀罐靠谱生产商有哪些,广州地区哪家比较靠谱?

随着工业循环系统、暖通空调等领域对稳压储能设备的需求激增,膨胀罐作为核心部件的市场关注度持续上升,但用户在选择供应商时往往面临质量参差售后无保障选型困难等痛点。本文围绕膨胀罐靠谱生产商、推荐膨胀罐厂、膨…

聊聊华宜家机械公司介绍,高效设备助力门厂家具厂生产

在门业与家具制造的智能化浪潮中,一台高效稳定的生产设备是企业降本增效的核心支撑,关乎产能突破与品质升级。面对市场上功能各异的机械制造公司,如何找到真正解决生产痛点的可靠伙伴?以下结合行业需求与客户反馈,…

赛瑞斯服务专业吗,与竞争对手相较哪个口碑好

2026年人口老龄化程度持续加深,术后康复、长者照护等专业家政服务需求呈爆发式增长,而护工专业性不足、服务安全无保障、收费不透明等行业痛点,让众多家庭在选择时陷入两难。在此背景下,筛选兼具专业实力、规范管理…

2026年江苏等地塑料制品生产商排名

2026年制造业数字化转型加速,塑料制品作为机械、汽车、家电等行业的核心配套部件,其生产商的技术实力、价格优势与服务能力直接决定下游企业的供应链稳定性与成本控制效率。无论是寻求高性价比的周转箱供应商、技术与…

helloWorld zilanxuan.cn 乐途

helloWorld zilanxuan.cn 乐途helloWorld zilanxuan.cn 乐途

刚刚,Anthropic内部考题开源!年薪百万工程师,被AI秒了

史上最强模型Claude Opus 4.5发布后,全面碾压了人类顶尖工程师,逼得Anthropic不得不被迫放弃招聘笔试!现在,内部考题已经全面开源了。 就在刚刚,人类程序员最后的堡垒崩塌了。 曾经,Anthropic为自己应聘者…