AI代码生成技术解析与应用实践

news/2025/10/21 20:08:31/文章来源:https://www.cnblogs.com/codeshare1135/p/19156334

AWS CodeWhisperer从自然语言创建计算机代码

在re:Invent大会上,某中心宣布CodeWhisperer预览版新增了对两种新编程语言的支持。

生成式AI系统现已具备以往难以想象的能力,例如生成大量类人文本、总结复杂文档、提出新颖药物配方或创作受无数人类艺术家或风格启发的艺术作品。如今,大型语言模型这种生成式AI形式已被应用于支撑它们自身的技术:计算机编码。

某中心CodeWhisperer是某中心提供的一项新的基于云的能力,它使用机器学习和大型语言模型来简化开发人员的工作并提高他们的生产力。

CodeWhisperer在开发人员的主要工作空间(称为集成开发环境,IDE)内工作。当开发人员构建代码时,他们通常会用自然语言留下注释,描述例如下一个代码块的目的或程序的整体目的。该系统不仅查看IDE中已生成的代码,还查看开发人员的注释,然后实时建议它预测有用的下一段代码。

“CodeWhisperer不仅仅是自动补全几个词或一行代码,”领导CodeWhisperer科学团队的高级应用科学经理表示,“它可以动态生成15、20、30行代码。这不是从其他地方复制粘贴的代码;它是根据开发人员的意图创建和定制的,并融入了编码最佳实践。”

当CodeWhisperer首次提供预览时,它支持Python、Java和JavaScript的代码推荐。今天在某中心的re:Invent会议上,团队宣布增加了C#和TypeScript编程语言。

“创新发生在开发人员花时间在新颖和创造性工作上时,”某机构AI实验室应用科学总监表示,“像CodeWhisperer这样的生成式AI可以轻松处理无差别的编码,并将人工交互留给需要高度判断的情况。”

这种帮助直到最近才成为可能,另一位负责人补充道。“AI在过去五年中加速发展,达到这些大型模型能够充分理解和推理以提供情境化推荐的程度。”而且,开发人员产生的代码和注释越多,CodeWhisperer就越能理解该代码的意图,因此其建议变得更加量身定制和细致入微。

可信代码

当然,使用公共数据集训练AI模型的缺点在于,它们可能反映更广泛世界中不良的方面,包括不完善的安全性、毒性以及对特定群体的不公平或偏见;它们还可能泄露个人可识别信息。

“在某中心CodeWhisperer,我们认真对待这些担忧,”某机构AI实验室高级首席科学家表示,“我们设计系统以帮助消除开发人员整个项目中的安全漏洞。我们还通过实时评估生成的代码并采取必要步骤减少用户接触此类内容,来解决其毒性和公平性问题。”

除了毒性和偏见过滤之外,CodeWhisperer的参考跟踪器功能还可以识别代码生成可能与特定训练数据相似的情况。然后,开发人员可以检查参考存储库,并决定是否使用该代码,包括是否从参考存储库获取依赖项或许可证。

团队在开发该系统时面临的另一个挑战涉及可持续性和速度。为了使CodeWhisperer对开发人员有任何用处,其建议需要在瞬间出现。一个好主意迟到20秒会是一种干扰,而不是帮助。挑战在于运行大型模型需要大量的计算资源——在时间至关重要时这不理想。

“我们通过利用各种技术来处理延迟问题,包括模型量化和内部开发的内存访问减少技术,这些技术允许在产生额外延迟成本的情况下提供多个推荐,”总监表示,“这些效率也提升了工具的可持续性。”

CodeWhisperer只是广泛的科学团队正在进行的以生成式AI和大型语言模型为核心的一系列项目之一。他们的主题范围从搜索和推荐到问答和信息提取。

多语言性

为了支持更广泛的机器学习社区开发代码生成模型,该团队开发了一个基准测试工具,支持评估10多种编程语言的代码生成能力。为了实现这一目标,团队开发了一种新颖的转译器——一种编程语言转换工具——自动将流行的Python基准测试数据集(最基本编程问题,MBPP)的输入文本和测试用例转换为它们的多语言对应物。他们在目前正在会议提交但可作为预印本在arXiv上获取的论文中描述了由此产生的基准测试数据集集合,他们称之为MBXP。

该工具不仅可用于评估各种编程语言中生成代码的质量,还可用于探索代码生成语言模型的更广泛方面。例如,它可用于探究大型语言模型在未经专门训练的其他编程语言上的泛化能力(剧透警告:在某些情况下出人意料地好)。

“多语言评估还使我们能够发现语言模型的有趣能力,例如它们的零样本翻译能力,模型可以使用语言A中的参考代码来帮助更准确地用语言B编写代码,”某机构机器学习科学家和该论文的第一作者表示,“MBXP使我们能够研究代码生成模型的其他方面,例如对输入的鲁棒性、代码插入能力,或少样本在减少语法错误方面的效果,所有这些都以多语言方式进行。”

通过公开发布这个多语言代码评估基准,团队希望加速这个新兴领域的研究。“而且由于语言转换是自动化的,”科学家说,“我们可以轻松地将基准扩展到包括未来的新编程语言,而无需大量的注释循环。”

CodeWhisperer产品和这些以研究为重点的创新只是机器学习为软件开发人员所能做的事情的开始,负责人解释道。“就像大型语言模型可以可靠地翻译口语一样,我们可以预期编程语言之间的翻译也会随之而来,”他说,“今天,CodeWhisperer不仅可以根据自然语言注释生成代码,而且还在朝着用自然语言总结给定代码片段预期功能的方向取得进展。”

在某种意义上,这正朝着编码的民主化和去神秘化方向发展。最终,编码的力量将不仅仅在于个人或团体精心拼凑代码的能力。

考虑生成式AI艺术的激增。现在,任何有想象力的人只需几个表达艺术意图的提示词就可以创作出令人难以置信的艺术作品。编码的自动化尚未取得如此大的进展,但AI对编码和自然语言日益提高的理解水平不仅将提升开发人员的专业能力,还将向更广泛的受众开放编码。“这是一项巨大的努力,”负责人说,“这是一个范式转变。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/942617.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

米理 课程描述/学习计划/Study program

其实没官方的模板,只是有个类似的东西 https://www.polimi.it/fileadmin/user_upload/futuri_studenti/ammissione-laurea-magistrale/Sample2.pdf

2025年线路调压器厂家推荐榜:10kv线路调压器/单相线路调压器/三相线路调压器/助力电网稳定运行,优选品牌指南

随着电力系统升级、新能源接入规模扩大及电网稳定性要求提升,线路调压器作为关键配电设备,已从传统电力行业扩展至工业、新能源、农村电网等多个领域。2025年,市场需求预计持续增长,但厂商技术实力、产品适配性及服…

2025 智能/商超照明/灯具/灯光/源头厂家推荐榜:上海富明阳凭分区域光效领跑,生鲜 / 百货场景适配优选

在商超竞争聚焦 “商品展示力” 的 2025 年,商超照明已从基础照明升级为 “提升商品吸引力、优化购物体验” 的核心工具。但行业普遍存在光效不均、场景适配差、能耗过高的痛点,优质服务商能精准破解难题。结合光效指…

2025 变电站厂家推荐榜最新资讯:撬装变电站/移动车载变电站/预制舱式变电站/移动变电站/预装式变电站/聚焦智能适配与可靠服务,这家企业成优选​

随着新型电力系统加速建设,新能源并网、电网改造及应急供电等需求持续攀升,变电站作为电力传输核心枢纽,其模块化、智能化与环境适配能力成为选型关键。2025 年全球预制舱箱式变电站市场规模已达 1966 百万美元,市…

银河麒麟Kylin申威SW64系统安装 rpcbind-1.2.5-2.p01.ky10.sw_64.rpm 方法

银河麒麟Kylin申威SW64系统安装 rpcbind-1.2.5-2.p01.ky10.sw_64.rpm 方法​ 一、准备工作​确认系统架构是申威(SW)的​ 一般这个包是专门为申威平台的银河麒麟操作系统(比如 KY10)准备的,你下载的包名里已经有 …

helloworld的输出

helloworld的输出public class hello {public static void main(String[] args){System.out.print("helloword");} }hello类名和文件名hello.java一样 cmd编译Java文件 1、cmd当前Java文件目录 2、javac hel…

2025 艺考文化课推荐榜:济南震华学校 5 星领跑,全阶段体系适配基础补弱到高分冲刺

随着艺考竞争加剧,艺考生对 “文化课精准补弱、高效提分、适配专业课时间” 的需求愈发迫切,专业艺考文化课培训需兼顾 “针对性与系统性”。结合课程完整性、提分效果、师资专业性与用户反馈,2025 年艺考文化课推荐…

2025 广州人力资源/派遣/劳务外包/人事代理/推荐榜:精典人才凭派遣合规 + 全场景适配领跑,企业用工优选

在广州企业用工需求日趋多元化的 2025 年,人力资源与人力资源派遣服务成为企业灵活配置人力、降低用工风险的核心选择。但行业中存在合规性不足、岗位适配差、售后支持弱等痛点,优质服务商可有效规避用工隐患。结合合…

png隐写文件与文件占用

png隐写文件正确解封装 1.ffmpeg自动推测。 2.得到推测格式为png_pipe,尝试使用mpegts格式进行解封装,打开成功并且媒体流大于0则认为成功。 3.使用mpegts上下文替换png上下文。 ps:部分vob文件需以mpeg格式打开。 文件…

Windows和Linux设置Https(SSL)访问 - 详解

Windows和Linux设置Https(SSL)访问 - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

题解:P12525 [Aboi Round 1] 私は雨

link 顺带一提这是我第一道没看题解做出来的黑(也是第四道黑)。 写完看了一圈题解,我想说: 欸不是凭啥我不用卡常啊? 前言 这篇题解的复杂度是这样的: 小 \(p\) \(O(q \sqrt n \log \sqrt n + n \sqrt V)\),大 …

完整教程:罗技G102有线鼠标自己维修教程

完整教程:罗技G102有线鼠标自己维修教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "M…

杂谈

代码如下,将这一段代码优化了下 string id = AAA(msg->msg_sender_);if (id.empty()){BBB(msg);VX_INFO_FUN_OUT();return;}#ifdef PROJECT_A//理论上不会到这里,因为id.empty会会处理,这里做一个保护if(U::i…

挖矿-学校挖矿排查

挖矿-学校挖矿排查 1、使用工具分析共有多少IP存在扫描web特征,提交其数量 这里我们直接访问百度网盘将流量下载到本地然后直接导入到 ZUI里面,这个工具很方便对流量进行筛选流量分析工具ZUI安装然后使用命令搜索 co…

读书日记2

四五章深入探讨了软件构建的关键前期工作,让我认识到优秀代码的质量在很大程度上是由设计阶段决定的。 核心收获与深刻见解: 1.设计的层次性思维:McConnell详细阐述了从系统架构到类设计,再到子程序设计的完整层次…

定位问题3:明明堆栈已经打印出来了,偏就是定位不出来?

堆栈如下,明明是在AAA::B函数里core了,而且是概率core的,可就是定位不出来 B函数很简单 1. 第一句打印入参 2. 其它都是函数调用 3. 打印退出消息 对于1 ,参数如下,不可能为nullptr,也排查了调用处(仅2处),不存…

Spring 统一机制处理 - 拦截器与适配器

Spring 统一机制处理 - 拦截器与适配器pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mon…

鸿蒙hdc命令【杭州多测师】

1、查看版本hdc -v2、查看连接设备hdc list targets3、安装应用hdc app install .\phone-launcher-default-signed.hap// 覆盖安装hdc app install -r .\phone-launcher-default-signed.hap// 安装、更新,多HAP可以指…

电脑黑屏只剩鼠标-解决方案 - 教程

电脑黑屏只剩鼠标-解决方案 - 教程2025-10-21 19:26 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !impo…

如何将海量纸质表格一键数字化?表格识别技术给出答案

在当今的智能办公时代,海量的信息仍被困在纸质文档或僵化的电子图片中,其中,结构复杂、数据密集的表格是信息数字化的主要瓶颈之一。表格识别技术的崛起,正如同一位不知疲倦的“数据捕手”,精准地破解了这一难题,…