Alexa进入自主时代:AI技术新突破

news/2025/10/5 12:46:35/文章来源:https://www.cnblogs.com/codeshare1135/p/19126476

Alexa于2014年推出,在过去的六年多时间里,我们一直在兑现让Alexa变得更智能的承诺。除了在语音识别和自然语言理解系统等Alexa核心AI技术方面的基础改进外,Alexa科学家还开发了持续为客户带来惊喜的技术,比如耳语语音和Alexa的新实时翻译服务。

但我们已开始引入的一些技术,加上我们正在研究的其他技术,都预示着Alexa发展将迎来阶段性变革——以及AI领域本身的变革。总的来说,这些技术将为Alexa语音服务和Alexa开发者可用工具带来新的通用性和自主性水平,开启人工智能的新"自主时代",在这个时代,像Alexa这样的AI系统将变得更加自我感知和自主学习,并且能够通过经验丰富的开发者甚至最终用户实现自助服务。

自我感知指的是保持对环境状态(例如时间、温控器读数和最近操作)的感知能力,并运用常识推理进行反映该感知和先验/世界知识的推断。Alexa直觉功能已经能够识别客户日常例程中的异常并提出修正建议——例如注意到夜间灯还亮着并主动提供关闭建议。在常识推理的支持下,自我感知更进一步:例如,如果客户在孩子足球训练结束前五分钟打开电视,未来的AI可能会推断客户需要接送提醒。

自主学习是Alexa在没有人为干预的情况下改进和扩展其能力的能力。与自我感知一样,自主学习也运用推理:例如,客户对某个操作的回应是否表明对该操作不满意?同样,当客户发出不熟悉的指令时,真正自主学习的Alexa将能够推断其可能含义——也许通过搜索网络或探索知识库——并提出可能性。

自助服务本质上意味着AI的民主化。没有编程经验的Alexa客户应该能够自定义Alexa服务,甚至创建新的Alexa功能,而没有机器学习经验的技能开发者应该能够构建复杂而稳健的对话技能。通俗地说,这些就是对话AI领域的无代码和低代码开发环境等价物。

需要明确的是,自主时代尚未完全到来,它的曙光需要仍在开发中的技术走向成熟,无论是在该中心还是其他地方。但Alexa最近推出的一些功能预示着东方天空的曙光。

自我感知
2018年,我们为智能家居推出了Alexa直觉功能,Alexa会根据异常传感器数据建议采取行动。到2021年初,科学已经进步到足以让我们推出一项选择加入服务,Alexa可以立即自动采取行动。同时,我们一直在努力将直觉功能扩展到智能家居以外的Alexa服务。

但常识推理需要更多能力——从可观察的时间模式推断客户隐含意图的能力。例如,如果客户调低温控器、关灯、锁前门并打开车库,这意味着什么?如果客户以"Alexa,Rolling Hills Cine Plaza在演什么?"这样的查询开始互动呢?

2020年,我们通过新的Alexa功能向常识推理迈出了步伐,该功能可以推断客户的潜在目标——一系列请求背后的最终目的。例如,当客户询问海滩天气时,Alexa可能会使用该查询,结合其他上下文信息,推断客户可能对去海滩旅行感兴趣。Alexa然后可以提供当前到海滩的驾驶时间。

为了检索该信息,Alexa必须知道将天气请求的位置映射到路线规划功能中的目的地变量。这说明了自我感知的另一个方面:跨上下文跟踪信息的能力。

这种能力是我们开发的夜间外出体验的核心,该体验让客户参与多轮对话,计划完整的夜间外出活动,从购买电影票到预订餐厅和共享乘车。夜间外出体验跨技能跟踪时间和地点,在客户评估不同选项时即时修订。为了构建该体验,我们利用了Alexa对话服务的机制,该服务使开发者能够快速轻松地创建对话驱动的技能,并且我们借鉴了关于对话状态跟踪的不断增长的研究成果。

然而,自我感知不仅包括对对话上下文的理解,还包括对客户物理上下文的理解。2020年,我们在配备摄像头的Alexa设备上演示了自然轮流发言。当多个发言者与Alexa互动时,Alexa可以使用视觉线索区分客户彼此之间的讲话和针对Alexa的讲话。在正在进行的工作中,我们正努力通过仅依赖声学和语言信号,将这种功能扩展到没有摄像头的设备。

最后,自我感知还需要自我解释的能力。今天,大多数机器学习模型都是黑盒子;即使是它们的创造者也不知道它们是如何工作的。这种不确定性使得可解释或可解释AI成为热门研究话题。

该中心积极发布关于可解释AI主题的研究。此外,Alexa基金(该中心的创业资本投资计划)投资了fiddler.ai,这是一家使用基于Shapley值的博弈论概念技术进行可解释AI的初创公司。

自主学习
历史上,AI开发周期涉及数据收集、数据注释以及在新注释数据上重新训练模型——所有这些加起来是一个费力的过程。

2019年,我们推出了Alexa的自主学习系统,该系统自动学习纠正错误——包括客户错误和Alexa语言理解模型中的错误——无需人工参与。该系统依赖于请求未被正确处理的内隐信号,例如当客户中断响应并重新表述相同请求时。

目前,该全自动系统正在纠正15%的缺陷。但这些都是跨用户群发生的缺陷;只有当足够多人隐式识别相同缺陷时,系统才会解决它。我们正在努力将相同机制适应个别客户的偏好——例如,Alexa可以学习当特定客户要求播放歌曲"Wow"时,她指的不是2019年Post Malone的热门歌曲,而是1978年Kate Bush的歌曲。

今天的客户还可以选择明确教导Alexa他们的偏好。2020年秋季,我们推出了客户交互式教学功能,该功能使客户能够指导Alexa他们希望如何处理某些请求。例如,客户可以教导Alexa"阅读模式"意味着灯光全开,而"电影模式"意味着只开百分之二十。

自助服务
交互式教学也是Alexa如何实现更多自助服务的早期例子。它扩展了先前的Alexa功能,如蓝图(让客户从现有模板构建自己的简单技能)和例程(让客户在单个命令下链接一系列操作)。

2021年3月,我们宣布公开发布Alexa对话,允许开发者通过上传示例对话创建对话驱动的技能。Alexa对话的复杂机器学习模型使用这些对话作为生成更大合成训练数据语料库的模板。从该数据中,Alexa对话自动训练机器学习模型。

然而,Alexa对话确实要求开发者指定新模型应操作的实体集和技能的应用程序编程接口。因此,虽然它需要很少的机器学习熟悉度,但它假设了一些编程经验。

我们正在稳步消除甚至该要求,通过使Alexa开发更轻松和直观。例如,随着Alexa技能库的增长,实体经常被重用,我们已经有了可以通知开发者他们可能没有想到添加到技能中的实体类型的系统。这是向自助服务模式迈出的一步,在该模式下,开发者不再需要提供详尽的实体列表——或者在某些情况下,根本不需要提供任何实体。

另一种使构建机器学习模型更容易的技术是少样本学习,其中现有模型仅使用少量新训练示例推广到相关任务。这是Alexa的一个活跃研究领域:例如,今年早些时候,我们在口语技术会议上发表了一篇论文,描述了一种用于自然语言理解任务的少样本学习新方法。与前辈相比,当每个模型仅用10个示例训练时,我们的方法在某些自然语言理解任务上将错误率降低了高达12.4%。

这些进展,连同该机构科学上报告的其他进展,表明Alexa AI团队继续加速其创新步伐。更多激动人心的公告即将到来。我会不时回到这里,向您更新Alexa进入自主时代的旅程。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/928263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

淮北市住房和城乡建设局网站html5韩国网站模板

当在 Java 项目中使用 Redis 时,特别是在 Spring Boot 项目中使用 Redis,下面是一个详细的教程,涵盖了 Redis 的配置和使用。 在 Spring Boot 项目中配置和使用 Redis 步骤 1:添加 Redis 依赖 在你的 Spring Boot 项目的 pom.x…

铜仁市网站建设情况南京微网站开发

功能描述:开发一个类似于 Windows 命令行提示符或 Linux 命令行终端的应用程序 一、最终演示效果 QtCmd 不是因为它是 Qt 的组件,而是采用 Qt 开发了一个类似 Windows 命令提示符或者 Linux 命令行终端的应用程序,故取名为 QtCmd。 上述演示…

入门AJAX——XMLHttpRequest(Get) - 教程

入门AJAX——XMLHttpRequest(Get) - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

知识付费网站搭建微信营销的功能

前段时间,写程序时,出了错误,竟然没有想到是自己属性命名的问题,哎~~~真是一定要注意规范呀,在这里我从网上找了些,规范作为参考 Sun 推荐的命名规范 1 ,类名要首字母大写,后面的单词…

公司网站php天河网站建设哪家好

文章目录 1. TSP案例引入2. 考虑惰性约束的求解效率对比2.1 求解基础TSP模型2.2 基于SCIP的Conshdlr添加惰性约束1. TSP案例引入 在运筹学建模和求解过程中,“lazy constraints”(惰性约束)是一种动态添加约束的策略,松弛部分约束后求解得到的“可行解”,不断地进行可行性…

ROM和RAM

1.1计算机中有两种存储器 (1)内存:内存与CPU接轨比较紧密,内存可以被CPU直接访问,内存可按照字节单位来随机访问,程序运行时离不开内存,程序中的变量都是定义在内存中,内存受限于物理技术和成本,容量比较小而…

深入解析:C#学习26天:内存优化的几种方法

深入解析:C#学习26天:内存优化的几种方法pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

电子商务网站建设 代码学校诗歌网站建设

在存在缓存的情况下,删除较前的slide,会出现当前slide与后一个slide重复出现的情况 假设当前存在5个slide,且这5个slide已缓存,则删除slide2后,仍为5个slide,且slide2的内容变为slide3的内容,此…

老板合作网站开发网销怎么做

日常工作中经常需要确定各个指标的权重,利用熵值法确定权重属于客观赋权法,从数据出发,避免过强的主观性,但是也同时带来了一些问题。在某个论坛的帖子中,作者提出了这样的一个问题:“熵值法用于确定权重是…

整理数据制作 直方图,箱须图,概率密度估计(KDE)图

1.导入库和设置 import math import numpy as np import matplotlib.mlab as mlab import matplotlib.pyplot as plt plt.rcParams[font.sans-serif]=[SimHei] # 设置中文字体,作用设置 matplotlib 使用中文字体显示…

云原生应用架构设计原则与落地实践:从理念到便捷的方法论

云原生应用架构设计原则与落地实践:从理念到便捷的方法论pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consola…

做装饰公司网站6wordpress添加直达链接

问题描述:边缘计算设备是什么意思。 问题解答: 边缘计算(Edge Computing)是一种计算模型,其主要思想是在距离数据产生源头更近的地方进行数据处理和计算,而不是将所有数据传输到远程云服务器进行处理。边…

基于本地模型+多级校验设计的高效缓存,有效节省token数量(有点鸡肋doge) - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

UCosIII 在 Tang Nano 20K 的 SparrowRV 软核移植

一直想完整的完成从FPGA到RTOS再到基础APP完成整个流程的理解,于是,尝试在开源的小麻雀操作系统上移植最简单的UCos-III移植,但由于不懂Verilog,所以磕磕碰碰,以下是其记录: 准备工作 由于使用的是一块小小的 Ta…

学做网站培训班要多少钱家电网站源码

2019独角兽企业重金招聘Python工程师标准>>> 1.安装oracle客户端 2.配置文件 加增一个数据库的方式,是编辑 tnsnames.ora文件,在C:\Oracle\Ora81\NETWORK\ADMIN 目录下. 增加类似下面的信息 SVR236 (DESCRIPTION (ADDRESS_LIST (ADDRESS (PROTOCOL …

深入解析:Elasticsearch的集群管理介绍

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

SIP抓包工具 SIP抓包 SIP抓包

SIP抓包工具 SIP抓包 SIP抓包 CentOS 环境 sngrep 安装及使用在呼叫中心类应用开发过程中,经常需要对 SIP 信令抓包,分析排查问题。通常抓包的工具非常多样,如 Wireshark、tcpdump、ngrep 等都是可选项,但是针对…

2025声级计厂家最新权威推荐排行榜单! 数字声级计,精密声级计,防爆声级计,手持式声级计,剂量声级计公司推荐!

在噪声污染愈发受到重视的当下,从工业生产的机器轰鸣到城市交通的持续喧嚣,从建筑施工的阵阵嘈杂到日常环境中的各类声响,准确监测噪声强度成为管控污染的核心环节。而声级计作为专业测量工具,其品类丰富多样 ——…

US$78.85 KEYDIY KD ZB10-4 Universal Smart Remote Key (Start) 4 Buttons for Honda Type 5pcs/lot

KEYDIY KD ZB10-4 Universal Smart Remote Key (Start) 4 Buttons for Honda Type 5pcs/lot Manufacturer: KEYDIY Condition: New Buttons: 4 Color: Black Proximity / Smart / Keyless Go: Yes KEYDIY Remote Serie…