死了么?还没!听我们说说Eigent产品背后的故事

Eigent 最近在海外出圈了,这其实连我们自己都有点意外。

我们在 Claude Cowork 发布后发了一条半开玩笑的帖子,没想到得到了很多关注,帖子获得了超过8.3k点赞和1.6M views,一天内Eigent的Github Star涨了 1000+。也收到了不少朋友和社区伙伴的关心,很多人来关心我们问需不需要帮忙。在这里统一回复一下大家:我们很好,大家不要担心!

虽然发帖语气轻松,但在伦敦的深夜国豪看完了Claude Cowork发布视频之后和文栋、璞真在客厅说:完了!Eigent(桌面端Agent产品)我们还做不做了?大家都有被Claude Code支配的恐惧,在面对这样的降维打击和大厂的资源压力,我们清楚正面竞争并不现实。我们一直坚持做开源,目标就是服务那些确实需要开源、本地部署、私有化能力的开发者和团队,在这个生态里找到自己的位置。

一、我们对Agent的思考

2023 年 3 月,我们发布了第一个基于大语言模型的多智能体协作框架 CAMEL。最初的想法很简单:如果让多个 AI 智能体像人一样分工、交流、合作,能不能解决更复杂的问题?

上线后一周,CAMEL 获得了 4000 多个 GitHub Star,论文也被 NeurIPS 接收,Andrew Ng 还在NeurIPS现场用手机拍了CAMEL 论文的poster。

CAMEL论文链接: https://arxiv.org/abs/2303.17760

CAMEL不仅是一个框架,也是我们对智能体核心能力的早期实验场。我们为智能体装备了搜索、终端、代码编辑器等基础工具,试图让它们不仅能“想”,更能“做”,能够在真实环境中获取信息、执行代码、验证结果。

这个“思考-行动-反馈”的闭环设计,成了我们所有后续工作的基石。我们基于这些思考,整合出了一个早期的、能真实执行任务的智能体原型。可以说,今天Eigent产品的许多设计灵感和架构雏形,都深深烙印着那段时期的探索。

这里也要跟大家回顾一下CAMEL一直在探索Agent的Scaling laws的三个维度:

  • 智能体的数量 (Number of agents):大规模智能体系统能够涌现出什么单智能体不能解决的问题,比如说社交网络等复杂系统模拟

  • 环境 (Environment):拓展智能体在复杂、多样化世界中感知、行动和学习的边界

  • 自我进化的扩展 (Evolution):探索智能体从经验中强化学习、持续学习、技能习得、记忆构建的能力

对Scaling Environment的追求,在2023年底催生了 CRAB 项目。我们当时怀揣一个大胆的设想:能否打造一个数字世界的通用智能体?在我们看来,人类在数字空间中最通用的“工具”,就是手机和电脑。如果智能体能像人一样操作这些设备,岂不是就能跨应用、跨平台完成几乎所有任务?

为此,我们开始了让智能体学习操控真实操作系统(如Android、Ubuntu)的探索。几乎在同一时期,学术界也涌现了如 OS World(它后来成为了该领域的标准评测基准)和 AppAgent 等优秀工作,大家在不同的路径上,朝着相似的愿景努力。

CRAB论文链接: https://arxiv.org/abs/2407.01511

二、产品尹始

2024年2月底,玮婕和Douglas 分别以产品、和设计师的身份加入团队,也是第一次团队在伦敦的线下见面,在共享办公室里探讨通用Agent的产品设计方案。

2024年4月,我们提出了Agent Workspace的概念,多智能体每个Agent可以有不同的Workspace,比如设计Agent可以有Figma,Coding Agent可以有Vscode和Terminal,Product Manager Agent 可以有搜索引擎和文档等等。

当时,团队整体是一种兴奋的摩拳擦掌的氛围。我们认为 “Workspace就是给agent一台自己的电脑。不同身份的Agent 安装使用不同的软件。“Agent可以操作浏览器、terminal,以及用API,GUI的方式操控软件虚拟机完成各种复杂任务。

2024年5月3日,当时国豪在伦敦还没有租房,半夜两点半在办公室点了一碗羊汤。思考白天团队讨论的产品想法,写下产品目标Mission Lambda - 我们希望做出通用的 multi-agent系统,让agent合作完成复杂任务(操控电脑/虚拟机)。写完吹了吹凌晨4点kingscross 的晚风,回来在同事桌子上睡了一宿。

当时产品MVP的开发已经如火如荼的推进中,但国豪其实一直有个挥之不去的隐忧:贸然去做一款应用且技术基础又不够扎实,产品会有种空中楼阁的感觉;而有限的资源也意味着,在开发过程中很难沉淀出CAMEL框架,无法将其打造成坚实的技术基础设施。

但看着兴奋的刚刚组建起来的团队,他有点不知道怎么开口。

2024年5月14日晚,国豪和玮婕在办公室附近的中餐馆吃晚饭。两人就团队资源和目标不匹配的问题一直聊到餐馆打烊,或许连中餐馆老板都听明白了我们面临的两大难题:

  1. CAMEL框架和CRAB(GUI 项目)作为基础设施并不成熟,不足以支撑产品级的开发;

  2. 以我们当时只有2个Engineer的团队来说想做到这个事情难于登天;

又是一个通宵,国豪写了“Lay the Foundation”,要求团队重点回到CAMEL框架和社区,暂停产品开发,打造基础设施。

自此之后,我们的重点转向了开源社区与技术钻研。将CAMEL框架打磨成产品级框架,成为了团队的第一优先级,这一目标,我们几乎投入了整整一年。

三、Eigent产品的萌芽

我们当时其实在同时推进3条基础设施研究线。

一是Agent 操控浏览器、写代码、调用工具,这就是后来的 OWL (GitHub 18.8k 星)。二是百万量级的智能体模拟,也就是 OASIS(GitHub 2.3k 星)。三是Data Generation,包括生成verifiable data,也就是是Loong这个项目(截至目前数据下载量近3万)、function calling data、tool integrated mathematical reasoning data。这也继CRAB之后我们进一步做Scaling environments 的工作,也是后面SEA (Scaling Environments for Agents)initiative的前置工作。

其中我们发现,OWL 距离真实落地场景已经很近。也正是因为一次偶然的爆火,加上基础设施的逐步成熟,我们决定重启 Mission Lambda,正式开始打造 Eigent 这个产品。也是因为 OWL 的爆火,那段时间我们几乎没日没夜地在解答社区伙伴的问题。微信群一度开到了 30 多个,几乎每天都能收到超过 200 条来自社区的反馈和问题。

  • OWL论文链接: https://arxiv.org/abs/2505.23885

  • OASIS论文链接:https://arxiv.org/abs/2411.11581

  • Loong论文链接:https://arxiv.org/abs/2509.03059

流量稍微平稳下来之后,我们决定去摩洛哥休假,也是在那段时间里,我们重新想清楚了 Eigent 这款产品的方向和整体规划。

我们要开发一款围绕工作效率场景的桌面端应用,为什么要是桌面端,是因为:

  1. 上下文:因为桌面端才能直接无缝接入用户的Context;

  2. 强大的智能体需要强大的权限,桌面端才能操控本地文件系统、软件甚至是系统级call和硬件;

  3. 桌面端也可以完成所有web端能做的事情,不管是通过Electron的Chromium浏览器,还是以浏览器插件的方式。

Eigent 的核心在于 CAMEL 的 Workforce 系统。它的设计受分布式系统的启发,通过分工调度,来解决复杂问题。

我们将系统划分为三个核心角色:Task Agent(任务拆分)、Coordinator Agent(任务分配)、Worker Agent(任务执行和工具调用)。配合异步任务通道,系统能自动构建“任务关系图”,实现无依赖任务的并行处理与有依赖任务的有序衔接,大幅提升处理效率。

针对大模型的不确定性,系统内置了多种容错策略:重试、重规划、转派、拆解。这种动态调整机制确保了任务执行的连贯性和稳定性。

只有当多智能体系统与日益强大的通用能力,例如使用浏览器和终端工具结合时,企业级自动化才真正有可能落地。

Eigent 的浏览器自动化方案采用控制与编排分离的双层架构。它的设计旨在突破僵化的 API 集成局限,让 Agent 具备在真实业务环境中的原生操作能力。

我们将架构解耦为两个核心层级:Python 层(AI 编排与决策)、TypeScript 层(原生交互与执行)。TypeScript 层利用 Playwright 原生优势,专攻 DOM 操作、SoM 标记渲染及遮挡检测;配合 WebSocket 异步通讯通道,系统实现了非阻塞式的指令流转,有效规避了纯 Python 方案的高延迟与底层访问限制。

因为我们自己缺乏MacOS和Windows双系统全栈产品开发的经验,在产品开发过程中其实遇到了不少困难。那段时间我们和两位外部全栈工程师一起推进了将近两个月,才终于把一个能在双系统完整跑起来的产品做出来。

为了这次发布,我们甚至还在伦敦找电影团队拍了一部“电影”去介绍Eigent这个多智能体协作产品的概念。

时间来到Eigent正式发布的时候,当时我们其实在沙特,准备服务我们第一家商业化大客户。

这里夹带一些私货,给大家看看我们团队在沙特发布产品的vlog😂

2025年7月29日晚Eigent 终于上线了,发布后20 小时内,注册用户突破 2000人,发布后一小时就有 2 位个人用户付费订阅,还有十几家企业客户主动联系,希望在他们的企业内部试用我们的产品。

但其实我们一开始的发布没有想清楚产品第一波面向的群体该是谁,加上产品的不稳定迫使我们进入沉寂期,我们需要重新思考产品的定位,到底应该服务什么样的客户,最后决定先聚焦b端和开发者。

2025年11月为了更好做企业交付,我们所有开发成员集中到常州开发。

虽然我们没有销售团队,但本地、工作场景、开源的产品定位为我们从社区吸引来了一些企业客户的信赖。

例如一家中东拥有1.1万名员工的大型企业,首先在他们的IT helping desk(IT 服务台)部门率先试点,让Eigent借助内部浏览器协助处理IT工单,从自动提取邮箱信息到填写系统表单,再到自主判断优先级并分配处理人员。

后续一家世界领先的头部开源数据公司希望用Eigent 应用于销售流程,让Eigent收集散落在邮箱、即时通讯软件,本地文件的销售线索,并使用浏览器整理到Salesforce 这样的系统中台。

为了打磨企业场景,我们构建了企业内部基准测试(Inner Enterprise Benchmark),例如Salesforce等CRM系统环境和任务以及Verifier。这受到Google Gemini 团队的关注,因此在 Gemini 3 系列研发期间,我们被邀请参与内测以及对模型能力进行评估。Google 官方也推荐 Eigent为下一代AI Agent 代表之一。

同时为了打磨产品基础能力,我们通过GAIA、WebArena、WebVoyage、Terminal-Bench等公开Benchmark打磨了browser toolkit和terminal toolkit。现在terminal toolkit已经用到产品了,terminal rl在研究结果上也已经有成果,就是我们前几天发布的项目SETA,被两位前OpenAI Cofounder 点赞(John Schulman,Andrej Karpathy),强化学习训练环境构建的经验也帮助我们拿下了几个客户,包括头部的大模型公司的环境和数据订单。

Terminal Toolkit设计图

Terminal RL的架构图

再到前两天因为我们的“自嘲式”推特帖子爆火了一次,截止今天,帖子一共有8000+点赞,150万浏览量了。

帖子爆火后我们收到了不少出乎意料的回应。一个xAI的内部员工邀请我们看看xAI,Hugging Face 的 Co-founder Thomas Wolf 也在评论区留言支持。我们也”顺手”把 openwork 的域名“斥巨资”买了下来,但还是决定坚持自己的 branding,不跟风改名。

同时我们也开始公开招全栈,结果没多久就有 Anthropic 的人在 LinkedIn 上主动加我们好友,看来我们现在也正式进入 Anthropic 的“雷达范围”了 😂

上线后,也有社区的小伙伴在 X 上分享了使用体验:“在 Linux 上成功跑通了,虽然中间遇到了一些小问题,但最后顺利跑起来了。接下来准备打包成 AppImage。”

也有开发者反馈,在 macOS 上搭配 LLM Studio 使用体验也不错。

与此同时,我们也和 MiniMax 达成了合作。他们在官方渠道发布了基于 Eigent 和 M2.1 模型的使用案例。

除了 M2.1,Eigent 也已经可以兼容运行如 智谱GLM-4.7、Kimi K2、Qwen3-235b等多个主流模型。

我们也和智谱合作,用智谱glm-4.7模型,让Eigent整理今天电脑桌面上的工作文件,并生成日报。

以及我们用Kimi K2、Qwen3-235b和DeepSeek-V3.2,做了两个填写Salesforce表单的任务用例。

就在刚刚,Eigent登顶了GitHub trending,成为了今天的第一名!

四、写在最后

我们想要打造的,是一款全栈的开源Agent系统,从模型到框架到产品,这也是为什么我们这么注重开源生态和强化学习的原因。

欢迎对这个愿景感兴趣的朋友加入我们的社区,一起打造这个未来!

也可以去给Eigent点个🌟呀:https://github.com/eigent-ai/eigent

Eigent官网:https://www.eigent.ai/


一起“赞”三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1186556.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何自定义UNet卡通化输出命名规则?文件管理技巧分享

如何自定义UNet卡通化输出命名规则?文件管理技巧分享 1. 功能概述 本工具基于阿里达摩院 ModelScope 的 DCT-Net 模型,支持将真人照片转换为卡通风格。核心模块采用 UNet 架构进行图像语义分割与风格迁移融合处理,在保留人物结构的同时实现…

BGE-M3功能全测评:CPU环境下语义分析性能表现

BGE-M3功能全测评:CPU环境下语义分析性能表现 1. 引言:为何选择BGE-M3进行语义分析? 在当前AI驱动的智能应用中,语义相似度计算已成为检索增强生成(RAG)、知识库构建、推荐系统等场景的核心能力。传统的关…

语音识别+情感事件标签同步解析|SenseVoice Small实战应用

语音识别情感事件标签同步解析|SenseVoice Small实战应用 1. 引言:多模态语音理解的新范式 随着人工智能在语音领域的持续演进,传统的自动语音识别(ASR)已无法满足复杂场景下的交互需求。用户不再仅仅关注“说了什么…

超详细版OpenSearch对elasticsearch向量检索适配解析

OpenSearch向量检索实战指南:从Elasticsearch兼容到语义搜索进阶你有没有遇到过这样的场景?用户在搜索框里输入“适合夏天穿的轻薄透气连衣裙”,结果返回的却是标题包含“连衣裙”但描述完全无关的商品。传统关键词匹配在这种语义理解任务上显…

MinerU 2.5教程:学术论文PDF元数据批量提取

MinerU 2.5教程:学术论文PDF元数据批量提取 1. 引言 1.1 学术文献处理的现实挑战 在科研与知识管理领域,学术论文 PDF 文档的自动化处理是一项长期存在的技术难题。传统文本提取工具(如 pdftotext、PyPDF2 等)在面对多栏排版、…

Fun-ASR-MLT-Nano-2512语音助手开发:自定义唤醒词教程

Fun-ASR-MLT-Nano-2512语音助手开发:自定义唤醒词教程 1. 章节概述 随着智能语音交互技术的普及,构建具备个性化唤醒能力的语音助手成为开发者关注的重点。Fun-ASR-MLT-Nano-2512 是阿里通义实验室推出的多语言语音识别大模型,支持 31 种语…

Voice Sculptor镜像核心优势解析|附指令化语音合成实战案例

Voice Sculptor镜像核心优势解析|附指令化语音合成实战案例 1. 技术背景与核心价值 近年来,语音合成技术(Text-to-Speech, TTS)在智能助手、有声内容创作、虚拟主播等场景中广泛应用。传统TTS系统往往依赖预设音色库或固定参数调…

Qwen1.5-0.5B-Chat快速上手:Conda环境部署详细步骤

Qwen1.5-0.5B-Chat快速上手:Conda环境部署详细步骤 1. 引言 1.1 轻量级对话模型的应用价值 随着大语言模型在各类应用场景中的广泛落地,对资源消耗低、响应速度快的轻量级模型需求日益增长。尤其在边缘设备、开发测试环境或低成本服务部署中&#xff…

Qwen-Image-Layered真实体验:RGBA图层拆分有多强?

Qwen-Image-Layered真实体验:RGBA图层拆分有多强? 运行环境说明 CPU:Intel(R) Xeon(R) Gold 6133 CPU 2.50GHzGPU:NVIDIA GeForce RTX 4090系统:Ubuntu 24.04.2 LTS显存容量:24GB(单卡&#xf…

SenseVoiceSmall教育场景落地:课堂情绪监测部署实战

SenseVoiceSmall教育场景落地:课堂情绪监测部署实战 1. 引言 1.1 教育智能化的语音新维度 随着AI技术在教育领域的深入应用,传统的教学评估方式正面临转型。教师授课质量、学生课堂参与度、学习情绪反馈等关键指标,长期以来依赖主观观察和…

BAAI/bge-m3对比实验:不同长度文本的向量稳定性测试

BAAI/bge-m3对比实验:不同长度文本的向量稳定性测试 1. 引言 1.1 选型背景 在构建检索增强生成(RAG)系统时,语义向量化模型的选择直接影响召回质量。BAAI/bge-m3 作为当前开源领域表现最优异的多语言嵌入模型之一,在…

2026年杭州青少年内衣供货厂家选购指南 - 2026年企业推荐榜

摘要 随着青少年健康意识提升,2026年杭州青少年女款内衣市场呈现快速发展趋势,家长对产品安全、舒适性要求日益增高。本文基于行业调研,推荐五家口碑优秀的供货厂家,榜单排名不分先后,旨在为消费者提供参考,包括…

AI艺术创作实战:用unet打造个性化漫画形象

AI艺术创作实战:用unet打造个性化漫画形象 1. 功能概述 本工具基于阿里达摩院 ModelScope 的 DCT-Net 模型,结合 UNet 网络结构优势,实现高质量人像到卡通风格的转换。系统通过深度学习模型对人物面部特征、轮廓线条和色彩分布进行建模&…

2026年杭州内裤供应商正规排名 - 2026年企业推荐榜

摘要 随着健康意识的提升,2026年杭州内裤供货行业迎来新发展,注重正规性、科技性与安全性。本文推荐五家正规内裤供货厂家,排名不分先后,旨在提供客观参考。榜单涵盖杭州天海星护科技有限公司等企业,每家均以独特…

VibeThinker-1.5B与主流小模型对比:推理效率与成本全面评测

VibeThinker-1.5B与主流小模型对比:推理效率与成本全面评测 1. 引言:小参数模型的推理能力新范式 近年来,大语言模型(LLM)在自然语言理解、代码生成和数学推理等任务上取得了显著进展。然而,随着模型参数…

内裤内衣耐穿公司2026年1月推荐榜 - 2026年企业推荐榜

文章摘要 本文基于2026年内衣行业趋势,推荐五家耐穿内裤内衣公司,涵盖杭州天海星护科技有限公司(星护盾)等企业。文章分析行业背景、公司优势,并提供客观选择指南,帮助消费者根据需求、技术、售后等维度做出明智…

5分钟上手YOLOv9,官方镜像让训练变简单

5分钟上手YOLOv9,官方镜像让训练变简单 在工业质检、自动驾驶和智能监控等场景中,目标检测模型的部署效率往往决定了项目落地的速度。传统方式下,开发者需要花费大量时间配置 PyTorch、CUDA 和各类依赖库,稍有不慎就会因版本不兼…

IndexTTS-2-LLM语音标注辅助:AI生成训练数据流程设计

IndexTTS-2-LLM语音标注辅助:AI生成训练数据流程设计 1. 引言 1.1 业务场景描述 在语音合成(TTS)模型的开发与优化过程中,高质量的语音标注数据是训练效果的关键保障。传统的人工录音标注方式成本高、周期长,尤其在…

热门的体育场剧院地板生产商哪家专业?2026年精选 - 行业平台推荐

在体育场馆、剧院等专业场所的地板选择中,专业性、耐用性、环保性及施工经验是核心考量因素。本文基于行业调研、用户口碑、项目案例及技术实力,精选出5家具备差异化优势的体育场剧院地板生产商,其中陕西民都实业有…

证件照背景复杂怎么办?AI工坊强鲁棒性抠图实战教程

证件照背景复杂怎么办?AI工坊强鲁棒性抠图实战教程 1. 引言:为什么传统证件照制作方式已过时? 在日常生活中,无论是办理身份证、护照、签证,还是投递简历、报名考试,我们都需要标准的红底或蓝底证件照。传…