CodeFuse是蚂蚁集团自研的代码大模型,支持40余种编程语言,可实现从自然语言到代码的精准转化,覆盖软件开发全生命周期。其"图生代码"功能能将设计图一键转化为代码,将前端开发效率从小时级提升至秒级。CodeFuse在多个技术榜单上超越GPT-4,代码生成采纳率达30%。它不仅提高编程效率,还降低技术门槛,推动软件开发新范式,目前已开放给全社会使用。
蚂蚁智信(杭州)信息技术有限公司,简称蚂蚁智信,成立于 2017 年 2 月 28 日,是蚂蚁集团的全资子公司。蚂蚁智信持续推动数字科技的创新与应用,在区块链、隐私计算、安全科技、分布式数据库、大数据等领域持续投入。同时,蚂蚁智信持续将自身产品与服务,向行业与社会全面开放,携手各方为中小金融机构的数字化升级、服务业小微商家的数字化经营、产业链的数字化协作贡献力量。
一、概述
CodeFuse 是蚂蚁集团自研的代码大模型,为蚂蚁百灵大模型家族成员之一。蚂蚁集团立足在 AI 时代探索下一代研发范式变革,最早提出“AI 全生命周期研发平台”概念,并在蚂蚁的研发场景中反复验证、迭代。CodeFuse 可以实现从自然语言到代码的精准转化,不仅能够理解复杂的编程需求,还能帮助开发者生成高质量的代码、自动增加注释,自动生成测试用例,修复和优化代码等,极大提升了软件开发效率与创新能力。无论用户是初学者还是有经验的开发者,CodeFuse 都能够极大地提高编程效率和准确性,让人人可编程、可创新成为现实。截至目前,CodeFuse 已支持 40 余种编程语言和 10 余个主流 IDE 平台,代码生成整体采纳率达 30%。 CodeFuse 代码大模型已开放给全社会,迄今累计开源 13 个代码仓库、4 个数据集、15 个大模型参数文件,Star 点赞数超过4000,下载量近 170 万。
二、需求分析
大模型时代,AI 程序员成为势不可挡的趋势。对个人开发者而言,AI 编程工具能够高效辅助完成从需求到代码实现的闭环过程。从企业维度则更关注整个研发流程的效率提升,除了关注代码生成的安全可靠可信,测试构建、发布运维以及数据洞察等方面也是至关重要的。
CodeFuse 源于蚂蚁自身的开发场景及代码库沉淀,基于海量高质量代码数据和代码领域特色词表,和多任务微调技术 MFT,在蚂蚁一万多内部研发人员的日常编码、测试、运维等场景中,经过反复验证与迭代,致力于通过打造软件研发交付人机协同新范式,通过 Agent 与人类工程师进行交互,实现从需求分析、产品设计、架构设计到前后端代码实现,以及 CR、测试等全流程智能体。
三、案例介绍
CodeFuse 是基于蚂蚁集团自研的百灵大模型进行微调的代码大模型,功能覆盖了需求分析、编程开发、测试与构建、发布与运维、数据洞察等企业研发工作的全生命周期,帮助开发者更快、更轻松地编写代码。在需求分析阶段,通过 Project Copilot,支持需求文档、设计稿、API 生成,信息搜索总结;在编程开发阶段,通过 Code Copilot,支持代码生成、补全、解释、注释、翻译等功能,还支持 PR 总结、代码评审;在测试与构建阶段,通过 Test Copilot,支持测试场景分析、测试代码生成、测试资产选取、测试知识问答;在发布与运维阶段,通过 Ops Copilot,支持监控时序分析、监控日志解读、监控语义搜索、智能变更与应急;
在数据洞察阶段,通过 Data Copilot,支持 SQL 语句生成,数据指标生成、数据报表生成、异动分析生成。目前,在蚂蚁内部,每周已有超五成程序员在日常研发中使用 CodeFuse。CodeFuse 生成的代码整体采纳率为 30%,在生成单元测试场景采纳率可以达到 50%。
CodeFuse 于 2024 年 4 月推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。“图生代码”功能主要服务前端工程师,在互联网产品开发环节,设计师画出设计图后,前端工程师需要用代码实现产品设计图,这项工作占用了较多开发工作量。图生代码可以根据设计图一键生成代码,可以极大降低开发团队在开发网页、小程序、APP 时的代码工作量。以一张中型网页为例,如果最终有 200 行代码,一人耗时约需 1 小时,一键生成后,工程师只需检查与调整,耗时大幅降低,把程序员在图转代码的研发效率从小时级提升至秒级。这项功能基于蚂蚁百灵大模型的多模态技术能力研发。
在自然语言生成代码、图生代码之后,CodeFuse 还将持续推出新功能,助力企业研发全链路的效率提升。
CodeFuse 的技术指标突出。2023 年 9 月,CodeFuse 开源,登顶开源代码大模型 HumanEval 榜单,超过
同期 GPT-4 表现。2024 年 2 月,CodeFuse 在权威机构 Big Code Models Leaderboard 代码大模型榜单上,以 43.58% WinRate 成为新晋榜首。
四、效益分析
CodeFuse 代码大模型的出现,探索了让软件开发新范式。
一是推动创新与技术进步:CodeFuse 的推出代表了人工智能与编程技术的深度融合,使得开发者能够更专注于创造性的工作,而非繁琐的重复性劳动。这种技术进步有望推动更多高质量、高创新性的软件产品的诞生。
二是提高编程效率与准确性:无论是初学者还是经验丰富的开发者,都可以利用智能辅助模型快速完成代码编写、优化和重构,极大地提高了编程效率和代码质量。这有助于降低软件开发的成本,同时提升产品的稳定性和用户体验。
三是降低技术门槛,拓宽人才库:CodeFuse 使得编程变得更加容易上手,即使是非专业的用户,也可以通过自然语言与 CodeFuse 交互,实现代码的生成和优化,推动更多人参与到软件开发中来,进一步拓宽了人才库。
四是提升社会整体的技术水平:CodeFuse 的普及和应用将有助于构建一个更加智能化、高效化的社会。
项目来源:2024大模型典型示范应用案例集。
CodeFuse除了作为一个IDE编程助手提供之外,官网已经提供了一个对话模型,支持对话式需求生成网站、模板生成、URL生成和Figma设计稿生成。体验需要申请邀请码。
如何学习AI大模型?
如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!
第一阶段:从大模型系统设计入手,讲解大模型的主要方法;
第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案
大模型全套视频教程
200本大模型PDF书籍
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集
大模型产品经理资源合集
大模型项目实战合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓