如何使用 ManySpeech 调用 SenseVoiceSmall 模型

news/2025/10/8 22:40:14/文章来源:https://www.cnblogs.com/manyeyes/p/19130235

一、模型与组件简介

  1. SenseVoice 模型
    多语言音频理解开源模型,支持语音识别、语种识别、情感识别等功能,适用于中、粤、英、日、韩等语言。
  2. ManySpeech.AliParaformerAsr
    C# 语音识别推理库,支持 paraformer-large、paraformer-seaco-large、sensevoice-small 等 ONNX 格式模型,包括流式(online)和非流式(offline)模型。

二、调用 SenseVoice-small 模型的三种方法

方法一:通过命令行参数(推荐新手)

  1. 运行 ManySpeech.AliParaformerAsr.Examples 示例程序
  2. 当控制台显示 “Enter parameters (press Enter to skip)” 时,输入:
-type offline -method one -model sensevoice-small-int8-onnx

3.按提示完成后续操作即可

方法二:修改示例代码默认值

1.打开示例项目中的 Program.cs 文件

2.找到 _defaultOfflineModelName 变量,修改为:

private static Dictionary<string, string> _defaultOfflineModelName = new Dictionary<string, string>{ { "aliparaformerasr", "sensevoice-small-int8-onnx" } 
};

3.重新编译运行程序,将默认使用 SenseVoice-small 模型

方法三:在自定义项目中集成

1.参考示例代码,将封装的核心方法(选中的文件)复制到你的项目中,如下图:

image

示例中封装的核心方法

2.调用识别方法之前,设置回调函数:

SetOfflineRecognizerCallbackForResult(recognizerType: "offline");

3.调用识别方法:

var methodType="one"; //"batch"
var modelAccuracy="int8"; //"fp32" 
var threads=2;
var files=new string[]{"to/path/file1.wav"};//默认支持wav类型
var modelBasePath="to/path/folder_name";//AppDomain.CurrentDomain.BaseDirectory
OfflineAliParaformerAsrRecognizer.OfflineRecognizer(    methodType,     "sensevoice-small-int8-onnx",  // 指定模型名称    
     modelAccuracy,     threads,     files,    modelBasePath );

在windows10+环境,如需支持更多音频格式,可将OfflineAliParaformerAsrRecognizer.cs 文件中 AudioHelper.GetFileSample方法修改为AudioHelper.GetMediaSample,将 OnlineAliParaformerAsrRecognizer.cs 文件中 AudioHelper.GetFileChunkSamples方法修改为 AudioHelper.GetMediaChunkSamples。

三、使用其他相关模型

  1. 访问魔搭模型库:
  2. 查找所需模型:
    搜索关键词,如:paraformer-largeparaformer-seaco-largesensevoice-small,找到相关的 ONNX 模型。
    示例:使用 wenetspeech-yue 数据集微调的 SenseVoice 模型
    模型地址:
    模型名称:sensevoice-small-wenetspeech-yue-onnx
  3. 替换上述方法中的模型名称参数即可

四、注意事项

1.区分模型类型:

  • 明确模型是流式(online)还是非流式(offline)
  • 示例:SenseVoice-small 为非流式(offline)模型,需指定 -type offline

2.模型格式要求:确保使用的模型文件是通过 FunAsr 导出的 ONNX 格式

3.参数配置:不同模型可能需要不同的参数配置,建议参考具体模型文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/932018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

北京免费发布企业信息网站建设网站哪家强

vmware与windows共享文件夹 宗旨&#xff1a;技术的学习是有限的&#xff0c;分享的精神是无限的。 虚拟工具安装好之后&#xff0c;我们就可以在windows和linux设置一个共享目录了,继续看图干活。 设置好共享目录以后&#xff0c;打开终端输入以下命令&#xff0c;就可以再…

维基框架 (Wiki Framework) v1.1.2 | 企业级微服务开发框架

Release Notes 版本修复日志【修复】修复HTTPS请求参数ContentType创建错误问题; 【修复】修复用户接口类 IUserDetailsService 被删除问题; 【修复】修复Spring Boot 全局响应处理增加对返回字符串兼容; 【修复】修…

宁夏公路建设局网站wordpress 中国风

Dubbo 支持哪些协议&#xff0c;每种协议的应用场景&#xff0c;优缺点&#xff1f; • dubbo&#xff1a; 单一长连接和 NIO 异步通讯&#xff0c;适合大并发小数据量的服务调用&#xff0c;以及消费者远大于提供者。传输协议 TCP&#xff0c;异步&#xff0c;Hessian 序列化…

如何将 iOS 性能调试融入日常创建流程?构建“默认监控机制”的实战经验(含 KeyMob 程序搭配)

如何将 iOS 性能调试融入日常创建流程?构建“默认监控机制”的实战经验(含 KeyMob 程序搭配)2025-10-08 22:32 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !imp…

国庆假期总结

🎉国庆总览🎉 学习🎯被学习充满的假期真是太充实(无聊)了机器学习。学习了吴恩达的机器学习,看了一百多集,实践做了小部分,我感觉到只学习到了皮毛,难的。其实只是选修课而已在这个学期,但是我想这是专业…

wordpress双语网站响应式网站开发实例

/任务2&#xff1a;if else 语句 编写控制台java程序&#xff0c;模拟银行取款的功能。 使用Scanner对象相关方法从控制台接收用户输入的银行卡账号和密码&#xff0c; 与预先定义好的银行卡账号密码相同则输出用户名密码正确&#xff0c;可以取款&#xff1b;如果账号或者密码…

普宁17网站一起做淘宝wordpress 评论 正在提交_请稍后

耳机自从手机出世之后就一直伴随着我们&#xff0c;作为手机的最佳搭档被我们使用&#xff0c;像现如今流行的蓝牙耳机我们就经常使用&#xff0c;大学生也是差不多每天都用得着&#xff0c;听歌、散步、玩游戏、看剧等哪都看得到它的身影&#xff0c;当然蓝牙耳机价格也有高低…

CF1738E Balance Addicts

Sol 神秘题目。 定义 \(pre_i=pre_{i-1}+a_i,suf_i=suf_{i+1}+a_{i+1}\)。 显然一个方案如果合法,\((i,i+1),(j,j+1)\) 位置均没有备选且满足 \(pre_i=suf_j\),那么加上 \((i,i+1),(j,j+1)\) 也同样合法。 所以考虑极…

2025浇注型聚氨酯厂家最新推荐榜:聚氨酯胶黏剂/聚氨酯胶辊/聚氨酯制品/聚氨酯原料/液体聚氨酯/聚氨酯浇注料/聚氨酯ABC料/浇筑聚氨酯/聚氨酯预聚物全场景实力厂家

在当今工业材料领域,浇注型聚氨酯作为一种高性能弹性体材料,因其优异的耐磨性、耐油性和机械强度,在机械制造、矿山设备、印刷包装等行业得到广泛应用。随着市场需求持续增长,如何从众多厂家中筛选出优质供应商成为…

优化 IIS 应用程序池配置,告别 ASP.NET 冷启动延迟

优化 IIS 应用程序池配置,告别 ASP.NET 冷启动延迟📌 摘要 在默认配置下,IIS 的 ASP.NET 应用程序池会在闲置 20 分钟后自动关闭。当下一个用户请求到达时,系统需要重新启动应用池并加载应用程序——这个过程就是…

C语言设计模式-策略模式

C语言,设计模式,策略模式#include <stdio.h> #include <stdlib.h>typedef signed int int32_t;void swap(int *a, int *b) {int tmp;tmp = *a;*a = *b;*b = tmp; }void print_arr(int arr[], int32_t le…

动态张量运算自动优化技术解析

本文介绍了一种名为DietCode的新型自动调度器,能够高效处理动态形状的张量运算,将优化过程加速6倍以上,同时使生成代码性能提升高达70%,显著提升机器学习工作效率。自动优化动态张量运算的执行 深度学习模型核心依…

网站首页关键词设置江苏建设厅网站电话多少

&#x1f4da;博客主页&#xff1a;爱敲代码的小杨. ✨专栏&#xff1a;《Java SE语法》 | 《数据结构与算法》 | 《C生万物》 ❤️感谢大家点赞&#x1f44d;&#x1f3fb;收藏⭐评论✍&#x1f3fb;&#xff0c;您的三连就是我持续更新的动力❤️ &#x1f64f;小杨水平有…

多线程插入也是随机io,那为啥不用uuid

多线程插入也是随机io,那为啥不用uuid首先,并发写入确实是随机io,但是uuid带来的页分裂更恶劣 而多线程并发写入有序id,操作系统有办法优化老实说ds说的有点牵强

企业网站制作规划织梦素材网站模板

用 Excel 处理数据时&#xff0c;有时需要对字符串进行拆分。对于比较简单的拆分&#xff0c;使用 Excel 函数可以顺利完成&#xff0c;但碰到一些特殊需求&#xff0c;或者拆分的规则比较复杂时&#xff0c;则很难用 Excel 实现了。这里列出一些拆分需求示例&#xff0c;分析拆…

国庆做题记录(含有一些trick)

这篇文章信息量偏大,请谨慎阅读,注意高效利用右边的目录。 1.1 二分 关联博文:Atserkcn-0/1分数规划 P1404 平均数 既然要让子串平均数最大,那就二分平均数,判断能否达到即可。复杂度 \(O(n\log V)\)。 关联题目:…

【Linux】如何移动材料/文件夹

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【PhysUnits】15.9 引入P1后的右移运算(shr.rs) - 详解

【PhysUnits】15.9 引入P1后的右移运算(shr.rs) - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&q…

[论文阅读]PPT: Backdoor Attacks on Pre-trained Models via Poisoned Prompt Tuning - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

10. 模型与视图

一、模型与视图模型/视图架构包含三部分:模型(Model)是应用对象,用来表示数据;视图(View)是模型的用户界面,用来显示数据;委托(Delegate,也被称为 代理)可以定制数据的渲染和编辑方式。通过数据和界面进行…