智能体上下文引擎(Agentic Context Engine,ACE)

news/2025/11/5 15:13:40/文章来源:https://www.cnblogs.com/sddai/p/19193701

 

人工智能代理会随着每次任务的完成而变得更加智能🧠

Agentic Context Engine 会从代理的成功和失败中学习。只需接入系统,即可见证代理的改进。

如果你觉得这个仓库有用,请给它点个星⭐️!


🤖 LLM快速入门

  1. 将您最喜欢的编码代理(Cursor、Claude Code、Codex 等)指向Agents.md
  2. 立即行动!

✋ 快速入门

1. 安装

pip install ace-framework
 

2. 设置您的 API 密钥

export OPENAI_API_KEY="your-api-key"
# Or use Claude, Gemini, or 100+ other providers
 

3. 创建您的第一个 ACE 代理

from ace import LiteLLMClient, Generator, Playbook, Sample# Initialize with any LLM
llm = LiteLLMClient(model="gpt-4o-mini")
generator = Generator(llm)# Use it like a normal LLM (no learning yet)
result = generator.generate(question="What is 2+2?",context="Be direct"
)
print(f"Answer: {result.final_answer}")
 

就是这样!现在让我们让它学习和改进吧

from ace import OfflineAdapter, Reflector, Curator, SimpleEnvironment# Create ACE learning system
playbook = Playbook()
adapter = OfflineAdapter(playbook=playbook,generator=generator,reflector=Reflector(llm),curator=Curator(llm)
)# Teach it from examples (it learns patterns)
samples = [Sample(question="What is 2+2?", ground_truth="4"),Sample(question="Capital of France?", ground_truth="Paris"),
]results = adapter.run(samples, SimpleEnvironment(), epochs=1)
print(f"✅ Learned {len(playbook.bullets())} strategies!")# Now use the improved agent
result = generator.generate(question="What is 5+3?",playbook=playbook  # ← Uses learned strategies
)
print(f"🧠 Smarter answer: {result.final_answer}")# Save and reuse later
playbook.save_to_file("my_agent.json")
 

🎉您的智能代理变得更智能了!它从示例中学习并不断改进。

还想了解更多?请查看:

  • 📘包含自定义环境的完整示例
  • 🌊海马表情符号挑战演示
  • 📚 ACE完整指南

为什么选择 Agentic Context Engine (ACE)?

人工智能代理会反复犯同样的错误。

ACE 使智能体能够从执行反馈中学习:哪些有效,哪些无效,并持续改进。
无需训练数据,无需微调,即可实现自动改进。

明确收益

  • 📈性能提升 20-35%:在复杂任务中已证实性能提升显著
  • 🧠自我提升:智能体在每次任务中都会变得更聪明
  • 🔄无上下文折叠:长期保存宝贵知识
  • 🚀 100+ 家 LLM 提供商:与 OpenAI、Anthropic、Google 等合作
  • 📊生产环境可观测性:内置 Opik 集成,用于企业监控

演示

🌊 海马表情符号挑战

这项挑战中,LLM(语言学习大师)经常会产生幻觉,认为海马表情符号存在(实际上并不存在)。观看 ACE 如何实时从自身错误中学习。此演示展示了 ACE 如何应对这项臭名昭著的挑战!

Kayba 测试演示

在这个例子中:

  • 第一轮:代理错误地输出了🐴(马的表情符号)
  • 自我反思:ACE无需任何外部反馈即可进行反思。
  • 第二轮:利用从ACE中学习到的策略,智能体成功识别出没有海马表情符号。

自己试试:

python examples/kayba_ace_test.py
 

Agentic Context Engine (ACE) 的工作原理是什么?

基于斯坦福大学和SambaNova的ACE研究框架

ACE 使用三个专门的角色协同工作:

  1. 🎯 生成器- 使用从剧本中学习到的策略执行任务
  2. 🔍 反思器- 分析每次执行后哪些有效哪些无效。
  3. 📝 策展人- 根据反思更新策略手册

ACE 教导你的代理人并使其内化:

  • ✅ 成功案例→ 提取有效模式
  • ❌失败案例→ 学习如何避免失败
  • 🔧 工具使用→ 了解哪些工具最适合哪些任务
  • 🎯 特殊情况→ 记住罕见情况以及如何处理它们

神奇之处在于“策略手册” ——一份随着经验不断演进的动态策略文档。
关键创新:所有学习都通过增量更新在情境中发生——无需微调,无需训练数据,并且完全透明地展现智能体学习到的内容。

 
 

安装选项

# Basic installation
pip install ace-framework# With demo support (browser automation)
pip install ace-framework[demos]# With LangChain support
pip install ace-framework[langchain]# With local model support
pip install ace-framework[transformers]# With all features
pip install ace-framework[all]# Development
pip install ace-framework[dev]# Development from source (contributors) - UV Method (10-100x faster)
git clone https://github.com/kayba-ai/agentic-context-engine
cd agentic-context-engine
uv sync# Development from source (contributors) - Traditional Method
git clone https://github.com/kayba-ai/agentic-context-engine
cd agentic-context-engine
pip install -e .
 

配置

ACE 通过 LiteLLM 与任何 LLM 提供商合作:

# OpenAI
client = LiteLLMClient(model="gpt-4o")# Anthropic Claude
client = LiteLLMClient(model="claude-3-5-sonnet-20241022")# Google Gemini
client = LiteLLMClient(model="gemini-pro")# Ollama (local)
client = LiteLLMClient(model="ollama/llama2")# With fallbacks for reliability
client = LiteLLMClient(model="gpt-4",fallbacks=["claude-3-haiku", "gpt-3.5-turbo"]
)
 

Opik的可观测性

ACE 内置了 Opik 集成,用于生产监控和调试。

快速入门

# Install with Opik support
pip install ace-framework opik# Set your Opik API key (or use local deployment)
export OPIK_API_KEY="your-api-key"
export OPIK_PROJECT_NAME="ace-project"
 

追踪哪些内容

当 Opik 可用时,ACE 会自动记录:

  • 生成器:输入问题、推理过程和最终答案
  • 反射器:误差分析和弹道分类
  • 策展人:剧本更新和增量操作
  • 战术手册演变:战略随时间的变化

查看痕迹

# Opik tracing is automatic - just run your ACE code normally
from ace import Generator, Reflector, Curator, Playbook
from ace.llm_providers import LiteLLMClient# All role interactions are automatically tracked
generator = Generator(llm_client)
output = generator.generate(question="What is 2+2?",context="Show your work",playbook=playbook
)
# View traces at https://www.comet.com/opik or your local Opik instance
 

优雅的降级

如果未安装或配置 Opik,ACE 仍可正常运行,无需进行跟踪。无需更改代码。


📊 基准测试

使用我们全面的基准测试套件,以科学严谨的方式评估 ACE 的性能。

快速基准测试

# Compare baseline vs ACE on any benchmark
uv run python scripts/run_benchmark.py simple_qa --limit 50 --compare# Run with proper train/test split (prevents overfitting)
uv run python scripts/run_benchmark.py finer_ord --limit 100# Baseline evaluation (no ACE learning)
uv run python scripts/run_benchmark.py hellaswag --limit 50 --skip-adaptation
 

可用基准

基准描述领域
简单问答 问答系统(SQuAD) 一般的
更精细的秩序 金融命名实体认可 金融
mmlu 大规模多任务语言理解 常识
hellaswag 常识推理 常识
arc_easy/arc_challenge AI2推理挑战 推理

评估模式

  • ACE模式:训练/测试集划分并进行学习(展现真正的泛化能力)
  • 基线模式:直接评估,不进行学习(--skip-adaptation
  • 对比模式:并排比较基线与ACE(--compare

基准测试系统通过自动 80/20 训练/测试集划分来防止过拟合,并提供过拟合分析以确保指标的真实性。

→ 完整基准测试文档


文档

  • 快速入门指南- 5 分钟即可开始跑步
  • API 参考- 完整的 API 文档
  • 示例- 可直接运行的代码示例
  • ACE框架指南- 深入探索智能体上下文工程
  • 提示工程- 高级提示技术
  • 更新日志- 查看最近的更改

贡献

我们欢迎投稿!请查看我们的投稿指南以开始投稿。


致谢

基于ACE 论文,并受到Dynamic Cheatsheet的启发。

如果您在研究中使用了ACE,请引用:

@article{zhang2024ace,title={Agentic Context Engineering},author={Zhang et al.},journal={arXiv:2510.04618},year={2024}}
 
 
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/956824.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年鲁冠高透光农膜企业权威推荐榜单:持久高透光抗老化农膜/95%以上高透光率农膜/黄瓜大棚高透光膜源头厂家精选

随着现代农业对光照管理和作物产量要求的不断提升,高透光农膜作为优化种植环境的关键材料,其市场需求持续增长。据行业相关数据显示,2024年中国功能性农膜市场规模已突破200亿元,年增长率保持在10%以上,其中高透光…

完整教程:Linux -- 传输层协议TCP

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年tpep防腐钢管制造企业权威推荐榜单:防腐螺旋钢管/防腐无缝钢管/聚乙烯防腐钢管源头厂家精选

在市政工程、石油天然气、水利建设等领域,TPEP防腐钢管凭借其优异的耐腐蚀性能与结构强度,已成为输送管道系统的核心材料。根据行业统计,2025年全球TPEP防腐钢管市场规模预计保持稳健增长,其中中国市场的增长表现突…

2025 最新推荐移民服务机构排行榜:精选靠谱中介,提供专业澳洲美国欧洲等国移民方案葡萄牙 / 新西兰 / 新加坡 / 购房移民公司推荐

引言 随着全球化发展,移民需求持续增长,移民服务机构数量激增,但行业质量参差不齐,选择靠谱机构成为难题。为此,国际移民服务行业协会开展专项测评,结合近 3 年机构服务数据、客户满意度调查(有效样本超 2 万份…

2025年激光切割机供货商权威推荐榜单:机器人激光切割机/三维五轴激光切割机/皮秒激光切割机源头厂家精选

随着制造业智能化升级的持续推进,激光切割机作为工业加工的核心设备,其市场需求显著增长。据行业数据显示,2024年中国激光设备市场规模已突破800亿元,年增长率保持在10%以上,其中激光切割机在工业应用中的占比约4…

HT-LFCG-1525+:DC-1525M SMD-8Pin LTCC低通滤波器

HT-LFCG-1525+:DC-1525M SMD-8Pin LTCC低通滤波器在射频前端方案不断向高集成、高一致性演进的当下,HT-LFCG-1525+,以替代久经市场考验的LFCG-1525+。新品沿用8引脚表贴封装,尺寸兼容原有焊盘,无需更改PCB即可直接…

11-5 降压电路

好的,我们来一步步分析您描述的这个电路。 首先,根据您的描述,我绘制了以下电路图,以便我们更清晰地进行分析: circuit TDVCC_24V["+24V"] --> R1_240k["R1: 240kΩ"]VCC_24V --> R2_1…

【IEEE出版|上海海事大学主办】第六届智能电网与能源工程国际学术会议

第六届智能电网与能源工程国际学术会议将于2025年11月28日-30日在中国上海召开。会议旨在为智能电网、能源系统等领域的专家学者及企业发展人提供一个分享研究成果、讨论存在的问题与挑战、探索前沿科技的国际性合作交…

MySQL用户管理 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

LLM 时代,DataAgent WhaleTunnel 如何将数据库变更瞬时 “转译” 为洞察?

在软件世界中,用户的形态正在发生变化。在软件世界中,用户的形态正在发生变化。 过去,软件的使用者是工程师、分析师或运维人员;而如今,他们正在被一群“数字化身”——Agent 所取代。AI 不再只是一个算法模型,而…

windows不显示欢迎界面

当netplwiz工具中缺少取消开机密码的选项时 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\PasswordLess\Device 修改键值:双击 DevicePasswordLessBuildVersion,将其数值数据从默认的 2 改为 0…

深入解析:C语言字符串安全查找 :strchr_s、strrchr_s、strstr_s

深入解析:C语言字符串安全查找 :strchr_s、strrchr_s、strstr_spre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "…

2025年靠谱的连锁泡菜加盟公司排名,泡菜加盟正规公司推荐

2025年餐饮加盟市场持续升温,泡菜品类凭借酸辣开胃的风味、灵活的消费场景,成为创业者青睐的赛道。但行业中加盟品牌鱼龙混杂:部分品牌无核心技术沉淀,产品同质化严重;部分快招公司圈钱跑路,让创业者血本无归;还…

2025年消雾装置冷却塔供货厂家权威推荐:消雾冷却塔/消雾冷却塔选型/消雾冷却塔变频源头厂家精选

随着国家环保政策收紧和工业节水需求提升,消雾装置冷却塔市场年增长率已连续三年超过15%,其中高效节水型产品占据市场份额的45%以上。 消雾装置冷却塔作为工业循环水系统的核心设备,正朝着高效消雾、节能降噪、智能…

深入解析:多模态医疗大模型Python编程合规前置化与智能体持续学习研究(中)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

前端图片压缩三方库browser-image-compression的使用实践

上篇文章是deepseek给出的前端图片压缩方案建议,后经过查看各第三方库的github项目和压缩后相同大小文件的对比,可以得出结论,这几个三方库其实也都是浏览器原生Canvas API的封装.当然,不管它们怎么实现的,只要用起来方…

特氟龙喷涂厂家TOP5推荐:特氟龙喷涂厂家推荐指南

在众多工业防护涂层中,特氟龙喷涂凭借其独特的性能优势,在密封圈、食品模具、化工设备等多个领域广泛应用,市场对优质特氟龙喷涂厂家的需求也日益增长。然而,企业在选择厂家时,常面临诸多困惑,如基础性能不达标、…

网络图片下载+VideCoding+DeepSeekOCR解析实践

网络图片下载+VideCoding+DeepSeekOCR解析实践背景 某高校师资网站全面采用网络图片展示,网站是禁止右键使用下载,也不允许复制信息。我们试图采集这些信息,使用目前智能体任务+VibeCoding+Deepsee-OCR解析来…

如何处理旧 iPhone:安全地回收或重新利用 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

给图片添加水印接口(文字水印和照片水印)

最近在调试的时候,发现打印出来的卡证上姓名处本来应该是中文名的地方,结果出现了三个方框。初步怀疑是再给图片加水印的时候乱码了(原本服务器是Windows的,后面换成Linux)。经过排查,发现代码中有调用Graphics2…