AI语音交互已经成为智能产品的基础配置,比如常见的AI玩具、智能家居、带AI功能的蓝牙音响,还有汽车的智能车机和智能穿戴设备等。唯创知音顺应市场趋势推出了WT2606A系列的AI语音交互芯片,和WT3000A M06、WT3000A M07、WT3000A M08三款AI语音交互模组。
WT2606A AI语音交互芯片介绍
WT2606A是一款高性能存算一体AI交互芯片,采用QFN40 5x5mm的经凑封装,搭载32位DSP架构,主频高达160MHz,支持IEEE754单精度浮点运算,配备640KB SRAM,可高效处理复杂音频算法与实时数据。集成双麦克风阵列拾音,多格式编解码以及8-48KHz音频采样能力,结合AI降噪技术,能够有效的消除环境噪音,确保语音交互清晰流畅,支持多轮连续对话和打断。
集成蓝牙功能符合蓝牙V5.3+BR+EDR+BLE规范,实现蓝牙发送以及接收功能。同时支持丰富的端侧扩展接口,便于外围功能拓展。WT2606A专为智能语音终端设计,支持本地化部署唤醒、降噪、打断等算法,轻松集成第三方Wi-Fi模块,广泛应用于AI对话、语音识别、对讲、播报及录音上传等场景。其高算力、低功耗与高集成度特性,使其成为赋予千行百业产品语音交互能力的理想解决方案,助力客户快速实现产品智能化升级。
标准UART通信接口,默认波特率9600,支持通过串口命令设置波特率;支持SPI-Flash、TF卡、U盘做为存储器。带有文件索引播放、插播、单曲循环、所有曲目循环、随机播放等功能。0~31级音量可调、最大可以支持外挂128Mbit的Flash,32G的TF卡和32G的U盘等(TF和U盘支持格式FAT或FAT32),支持FAT32格式U盘升级程序;
Ø 上电默认不播放;具备BUSY状态指示、BUSY平时为低电平,播放时为高电平;
Ø 支持语音高品质音频格式,支持MP3和WAV格式,(支持采样率8K-44.1K,码率8kbps~320kbps)声音优美;
Ø 工作电压:2.8V~4.2V;
两个16位异步分频器定时器;
Ø 24 bit高精度Audio ADC;24 bit高精度DAC;
Ø IO驱动能力,可驱动8mA;
Ø 支持SD卡/U盘离线升级程序,建议画板时预留出USB接口;
Ø 通过USB接口连接电脑,电脑上显示Flash或TF卡盘符,直接从电脑拷贝音频到盘符,拷贝完成后,需拔掉USB线,再进行串口控制播放,否则串口发码无响应;
Ø 重点注意:语音芯片如果需要挂flash。建议使用“唯创”出的flash,其他厂商的flash,不能保证可以正常工作。(建议将150mil和208mil尺寸兼容扩展画上,更方便备货)。
AI交互模组WT3000A M06 介绍
WT3000A M系列(含WT3000A M06 /WT3000A M07/WT3000A M08)模组是一款功能强大的语音交互模组,集成语音芯片和 WIFI 芯片,支持语音唤醒打断、UART 串口指令、Websocket 协议进行流式音频上下行、MQTT 指令控制,其中语音芯片 WT2606AX-40N 是一款功能强大的高品质语音芯片,采用了高性能 32 位处理器、最高频率可达 160MHz,QFN40 封装,5*5mm。
支持在线TTS芯片方案,相较于传统离线 TTS 语音芯片,在线 TTS 支持语种、音色、语速等多项参数切 换,在情绪演绎、拟人度等各方面为客户带来更生动、更具情感表现力的听觉体验。文本合成不受芯片本地容量资源限制,可将大量的文本及音频内容储存在云端。支持 16 国语种 6 种国内方言切换、超拟人音色、支持本地音频及录音播放下载、支持打断、切换、暂停、音量大小调节,芯片最快可达 1.5s 播放响应。该芯片及模组支持 UART 通讯,配套 PC 串口工具、APP 协助调试。
离在线识别芯片方案,支持离线唤醒,词条可在线修改、自动下发,无需在本地训练。支持 51 国语 种 23 种国内方言切换,灵活创建识别词条,自定义个性回复音:可通过 APP 内进行 TTS、录音、上传本地 音频,创建专属化词条。同时支持离线 UART 串口对接协议,用于开发者 MCU 对接,控制本地自有设备, 如灯控、屏显、电机等。
AI对话:语音打断唤醒,流媒体上传、流媒体播放下载,支持按键打断、音量调节,开放 API 接口, 具备集成大模型能力。目前 AI 对话支持以下技能:支持角色创建、对话、天气(通过经纬度设置获取所在地天气)、故事、新闻、自定义企业知识库等。
以上就是关于唯创知音AI语音交互芯片和AI语音交互模组的介绍,如果您还有更多关于AI语音交互芯片或模组的问题可以联系唯创知音厂家索要相关的产品资料或寻求工程师协助。