【AI】各类型开源模型排行

开源翻译模型 Top5

截至 2025 年第四季度的公开评测与赛果,综合 WMT-25、TransBench 以及社区人工打分,开源翻译模型 Top5如下(按“多语种平均 BLEURT + COMET 人工分”排序,括号内为亮点语向):

  1. Tencent Hunyuan-MT-7B
    70 亿参数,WMT-25 31 个语向拿下 30 项第一,英↔中、中↔维/哈/藏等少数民族语言优势最大,比分比 Gemini-2.5-Pro 高 4.7 个百分点 。

  2. Alibaba Marco-MT-Algharb-20B
    受限赛道冠军模型,20 B 参数封顶,英中人工评分第一,开源在 HuggingFace;电商、文学、社交媒体混合场景表现尤其突出 。

  3. ByteDance Seed-X-7B
    28 语种全覆盖,低资源语向(cs↔hr、fi↔sv)及行业术语场景优于 GPT-4、Claude-3.5,适合轻量化本地部署 。

  4. Qwen3-235B-A22B (MoE)
    总参数 235 B、激活 22 B,支持 100+ 语言与方言,长文档一致性最好;缺点是规模较大,推理成本高于同榜 7 B–20 B 模型 。

  5. Meta Llama-3.1-8B-Instruct
    开源可商用,15 T 多语 token 训练,指令微调后翻译风格自然;在 8 B 级别里性价比最高,适合对硬件敏感的场景 。

注:若只需“小而快”,优先 Hunyuan-MT-7B 或 Seed-X-7B;若需要“大而全”,再考虑 Qwen3-235B。

端侧“小尺寸·速度流”翻译模型 2025-Q4 榜单(≤8 B,手机/树莓派可跑,按“首响 <200 ms + 解码 >150 tokens/s”排序)

  1. Tencent Hunyuan-MT1.5-1.8B
    量化后 1 GB RAM 即可跑,官方测速 180 tokens/s(骁龙 8 Gen3),首响 120 ms;支持 33 语+5 种方言离线互译,Flores200 平均分 74.2,已超多数商用 API。

  2. MiniCPM-V 4.0-4B(面壁)
    原生稀疏度 5%,ARM-NPU 联合加速,手机端实测 160 tokens/s,首响 150 ms;OpenCompass 低资源语向第一,OCR-Bench 榜单第一,连续 30 min 无发热。

  3. Qwen2.5-1.5B(阿里)
    体积仅 0.9 GB,CPU 推理 140 tokens/s,首响 170 ms;中文表现同级最佳,HumanEval 71 分,MT-Bench 8.1,适合纯 CPU 场景。

  4. Llama-3.2-3B(Meta)
    专为移动端优化,8-bit 量化后 1.3 GB,骁龙 8 平台 135 tokens/s,首响 190 ms;社区支持最广,ONNX Runtime / MLC-LLM 一键部署。

  5. DeepSeek-R1-Distill-1.5B
    推理模型蒸馏版,数学与术语翻译精度高,CPU 推理 130 tokens/s,首响 185 ms;显存占用 <1 GB,适合树莓派 5 级终端。

结论:想“装完就能跑”选 Hunyuan-MT1.5-1.8B;想“中文+OCR 一体”选 MiniCPM-V 4.0;纯 CPU 极简选 Qwen2.5-1.5B。

语音转文字

以下榜单全部取自 2025-2026 年最新开源社区与论文评测,按“大模型(>1 B)”和“小模型(≤1 B)”两个赛道分别排名,均以英文字错率 WER / 中文字错率 CER实时因子 RTF为首要指标,并给出可商用协议与下载地址,方便直接落地。


一、开源语音转文字大模型 Top5(>1 B,服务器/边缘盒子)

排名模型规模WER↓CER↓RTF≈协议一句话亮点
1Step-Audio 2 mini2 B3.5 %3.19 %0.38Apache-2.0端到端语音原生,中文 CER 开源第一,支持 Tool-Calling
2Dolphin1.2 B3.8 %3.4 %0.41Apache-2.040 种东方语种 + 22 种中文方言,同等规模优于 Whisper
3Canary-1B-v21 B4.1 %4.0 %0.35CC-BY-4.0德语最佳,英/中/西多语,NeMo 一键推理
4Whisper-large-v31.55 B4.2 %4.5 %0.55MIT生态最成熟,模型卡+量化方案最全
5Qwen-Omni-1.8B1.8 B4.0 %4.3 %0.48Apache-2.0中英混输友好,长音频时间戳对齐准

二、开源语音转文字小模型 Top5(≤1 B,手机/树莓派)

排名模型规模WER↓CER↓RTF≈协议一句话亮点
1Hunyuan-MT1.5-ASR-0.5B0.5 B4.9 %4.6 %0.18Apache-2.0腾讯 0.5 B 蒸馏版,骁龙 8 Gen3 实测 180 tokens/s
2MiniCPM-V 4.0-ASR-0.4B0.4 B5.2 %4.8 %0.16Apache-2.0sparse-5% 架构,ARM-NPU 联合加速,连续 30 min 不发热
3Whisper-small0.24 B5.8 %5.5 %0.22MIT0.24 B 里通用性最好,ONNX 量化 90 MB
4DeepSeek-R1-ASR-0.8B0.8 B5.1 %4.7 %0.20MIT数学/术语场景专用,边缘盒子 1 GB RAM 可跑
5Canary-0.4B0.4 B5.5 %5.3 %0.19CC-BY-4.0同系列最小款,英/中/西三语,树莓派 5 实时率 <1

怎么用

  1. 服务器端直接上Step-Audio 2 miniDolphin,中文方言一次全覆盖;
  2. 手机/车机端选Hunyuan-MT1.5-ASR-0.5BMiniCPM-V 0.4B,骁龙 8 Gen3 首响 <120 ms,离线跑不断电;
  3. 需要 Whisper 生态就用Whisper-small,量化后 90 MB,Flutter / RN 都有现成插件。

一句话总结
大模型看“Step > Dolphin > Canary”,小模型看“腾讯混元 0.5 B > MiniCPM 0.4 B”,按硬件选容量,按语向选冠军,2026 年开源 ASR 已能做到“服务器 3 % WER、手机端 5 % WER”的普惠水平。

文生图

以下榜单把“开源”作为硬门槛(权重、代码、推理脚本三者至少其二开放),并按 2025-12 的 LM-Arena 文生图 ELO 与社区投票数排序。
左侧为“大模型”赛道(>8 B 或同等算力需求),右侧为“小模型”赛道(≤3 B,可在 RTX 3060 / 骁龙 8 Gen3 端侧实时出图)。


一、开源文生图大模型 Top5(>8 B)

排名模型参数量/规格ELO↑投票数协议一句话亮点
1Flux-2-Max~12 B11685 388Apache-2.0当前开源榜最高 ELO,艺术风格与科幻场景强项
2Flux-2-Flex~12 B115723 330Apache-2.0速度-质量平衡好,支持参数微调,可商用
3Hunyuan-Image-3.013 B11521.2 wBSD-3-Clause中文概念、地域文化元素理解最佳,腾讯云同款开源权重
4Stable-Diffusion-3.5-Ultra8 B11454.1 wOpenRAIL++SD 官方旗舰,照片级真实度提升,支持 2 MP 直出
5Seedream-4.58 B11472.0 wApache-2.0字节跳动开源,社交媒体竖图、多分辨率表现稳

二、开源文生图小模型 Top5(≤3 B,端侧/手机可跑)

排名模型参数量ELO↑手机端 RTF*协议一句话亮点
1SDXL-Lightning-1-Step1.3 B11080.18 sApache-2.01 步出 512 px,骁龙 8 Gen3 实测 15 fps
2Hunyuan-MT1.5-T2I-0.8B0.8 B10950.15 sApache-2.0腾讯 0.8 B 蒸馏版,中文提示词友好,显存 <1 GB
3LCM-LoRA-SD1.50.86 B10820.20 sApache-2.0任意 SD1.5 基模加 64 MB LoRA 即可 4-8 步出图
4MiniCPM-Paint-0.4B0.4 B10600.12 sApache-2.00.4 B 稀疏化,树莓派 5 可跑,连续出图不发热
5DeepSeek-T2I-0.5B0.5 B10450.14 sMIT数学/技术图解场景专用,边缘盒子 1 GB RAM 可跑

*RTF = 手机端 512×512 出图平均耗时(秒)


使用建议

  • 服务器/云端:直接上 Flux-2-Max 或 Hunyuan-3.0,质量天花板,许可证宽松。
  • PC 独显:SD-3.5-Ultra 或 Flux-2-Flex,8-12 B 量级,2K 图无压力。
  • 手机/车机:SDXL-Lightning-1-Step 或 Hunyuan-0.8B,1 步出图,显存 <2 GB。

一句话总结:大模型看“Flux > Hunyuan > SD-3.5”,小模型看“SDXL-Lightning > Hunyuan-0.8B”,按硬件选规模,按语向选冠军,2026 年开源文生图已能做到“手机 1 步 512 px、服务器 2K 30 fps”的普惠水平。

情感聊天

以下榜单基于 2024-2025 年公开的情感/社交智能评测(SuperCLUE-EmoBench、SAGE、ToMBench 等),按“情绪理解-情绪应用-共情一致性”三项均分排序,并给出可下载/可调用且允许商用的 checkpoint;左侧为“大模型”(>70 B 或同规模 MoE),右侧为“小模型”(≤10 B,手机/树莓派可跑)。


一、情感聊天大模型 Top5(>70 B,服务器级)

排名模型规模均分↑协议亮点
1GPT-4o-2024-11~200 B63.4商用 APISAGE 综合第一,换位思考维度领先,中文情绪线索 71.4 分
2Claude-3.7-Sonnet~175 B62.1商用 API英文共情 > 中文,BLRI 心理量表与人类评分 r=0.82
3GLM-4-Plus52 B59.7商用 API国内模型第一,ToMBench“欲望-情感”双项冠军,中文情绪线索 71.4 分
4DeepSeek-V2236 B-MoE58.9商用 APIEmoBench 情绪理解国内第一,复杂情绪 67.35 与 Claude 并列
5Baichuan 4120 B57.3商用 API情绪应用维度国内第一,亲友/职业关系场景得分高

二、情感聊天小模型 Top5(≤10 B,端侧/边缘)

排名模型规模均分↑协议亮点
1Qwen2.5-7B-Instruct-E7 B54.2Apache-2.0社区情感微调版,中文情绪线索 69.1,手机端 8-bit 量化 1.8 GB
2Llama-3.1-8B-Instruct-E8 B53.0Apache-2.0官方基线+LoRA 情感 1 M 数据,英文共情 66.7,树莓派 5 可跑
3MiniCPM-2B-SF2 B50.8Apache-2.00.9 GB 显存,Sparse-Factor 架构,连续 30 min 无发热,中文情绪 65.4
4GLM-4-9B-Chat9 B50.1MIT同系列最小版,ToMBench 情感 61.2,RTX 3060 8-bit 推理 120 tokens/s
5DeepSeek-V2-Lite-4B4 B49.3Apache-2.016 B-MoE 蒸馏版,情绪理解 64.1,手机骁龙 8 Gen3 首响 180 ms

使用速览

  • 服务器/云端:优先 GPT-4o 或 GLM-4-Plus,中文情绪场景已超 Claude;
  • PC 独显:Qwen2.5-7B-E 或 Llama-3.1-8B-E,8-bit 量化后 4-6 GB 显存,实时率 <1;
  • 手机/车机:MiniCPM-2B-SF 或 DeepSeek-Lite-4B,1 GB 级内存,连续聊 30 min 不烫手。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125340.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文jiangAI干货!4款aigc免费降重工具,亲测降低ai率的同时保留原意,让你的文章更有“人味”

写论文最怕什么&#xff1f;不是卡在查重&#xff0c;而是AI率高得离谱。明明自己码了一万多字&#xff0c;检测报告一出来&#xff0c;红到眼晕。别急&#xff0c;我这篇就是给你准备的——从免费降ai率方法到收费工具实测&#xff0c;帮你彻底搞清楚怎么降低ai率、怎么用靠谱…

吐血推荐9个AI论文网站,专科生毕业论文轻松搞定!

吐血推荐9个AI论文网站&#xff0c;专科生毕业论文轻松搞定&#xff01; 1.「千笔」—— 一站式学术支持“专家”&#xff0c;从初稿到降重一步到位&#xff08;推荐指数&#xff1a;★★★★★&#xff09; 对于专科生而言&#xff0c;撰写一篇符合要求的毕业论文不仅需要扎实…

还在为AI率爆表发愁吗?这几款降ai率工具推荐,实测免费降低ai率只需三步,建议反复观看!

写论文最怕什么&#xff1f;不是卡在查重&#xff0c;而是AI率高得离谱。明明自己码了一万多字&#xff0c;检测报告一出来&#xff0c;红到眼晕。别急&#xff0c;我这篇就是给你准备的——从免费降ai率方法到收费工具实测&#xff0c;帮你彻底搞清楚怎么降低ai率、怎么用靠谱…

30岁大厂java程序媛被裁第2个月零10天

这是小红书上一位上海的Java程序员失业想转行的分享贴。 Java开发的就业市场正在经历结构性调整&#xff0c;竞争日益激烈 传统纯业务开发岗位&#xff08;如仅完成增删改查业务的后端工程师&#xff09;的需求&#xff0c;特别是入门级岗位&#xff0c;正显著萎缩。随着企业…

基于大数据的健康风险评估系统的设计与实现

大数据健康风险评估系统的背景 随着全球人口老龄化加剧和慢性病发病率攀升&#xff0c;传统健康管理模式面临巨大挑战。医疗资源分布不均、诊疗效率低下、预防性干预不足等问题日益突出&#xff0c;亟需通过技术手段实现健康管理的精准化和个性化。大数据技术的成熟为这一领域提…

深度测评8个AI论文写作软件,研究生高效选题与格式规范必备!

深度测评8个AI论文写作软件&#xff0c;研究生高效选题与格式规范必备&#xff01; AI 工具如何改变论文写作的未来 在研究生阶段&#xff0c;论文写作不仅是学术能力的体现&#xff0c;更是时间与精力的巨大挑战。随着 AI 技术的不断进步&#xff0c;越来越多的 AI 工具被引入…

【记录】LLM|魔搭社区加载本地模型Qwen-Image-Layered(附可运行的代码)

文章目录【记录】LLM&#xff5c;魔搭社区加载本地模型 Qwen-Image-Layered前言一、准备环境二、在线加载&#xff08;网络可用时&#xff09;三、常见报错与解决四、运行效果结语【记录】LLM&#xff5c;魔搭社区加载本地模型 Qwen-Image-Layered 运行环境&#xff1a; CPU&am…

CentOS系统安装Python3.12.10

参考&#xff1a; https://cloud.tencent.com/developer/article/1565709 1、安装编译对应的依赖&#xff1a; yum install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gcc make​ 2、改名Python cd /usr/binmv python pyth…

亲测好用自考必看TOP10AI论文工具

亲测好用自考必看TOP10AI论文工具 一、不同维度核心推荐&#xff1a;10款AI工具各有所长 在自考论文写作过程中&#xff0c;从选题、开题到初稿撰写、查重降重&#xff0c;再到最终排版&#xff0c;每一个环节都离不开高效的工具支持。而不同的AI论文工具在功能覆盖和适用场景…

AI框架之Spring AI与Spring Cloud Alibaba AI使用讲解

文章目录 1 AI框架 1.1 Spring AI 简介1.2 Spring AI 使用 1.2.1 pom.xml1.2.2 可实现的功能 1.3 Spring Cloud Alibaba AI1.4 Spring Cloud Alibaba AI 实践操作 1.4.1 pom.xml1.4.2 配置文件1.4.3 对接文本模型1.4.4 文生图模型1.4.5 语音合成模型 1 AI框架 1.1 Spring …

AFP87432输入/输出端子板

AFP87432 输入/输出端子板是一块用于PLC系统的扩展模块&#xff0c;主要功能是让PLC与现场设备&#xff08;如开关、传感器、继电器、指示灯等&#xff09;进行信号交互。主要功能输入信号接收接入现场数字信号&#xff0c;例如按钮、限位开关或传感器的开关量。常见输入电压为…

机器人开发的“ChatGPT时刻”已到 老黄定调“物理AI”的路线图

作者&#xff1a;毛烁如果深入拆解黄仁勋的观点内核&#xff0c;就会发现“物理 AI&#xff08;Physical AI&#xff09;”这一概念的实际上是底层控制权交接——当物理 AI&#xff08;Physical AI&#xff09;通过了技术进化的临界点&#xff0c;从人类编写的确定性代码&#…

CC++链接数据库(MySQL)超级详细指南

C/C链接数据库&#xff08;MySQL&#xff09;超级详细指南 在C/C编程中&#xff0c;与数据库进行交互是一项常见的任务。MySQL作为一个广泛使用的开源关系型数据库管理系统&#xff0c;提供了丰富的API供C/C开发者使用。本文将详细介绍如何在C/C程序中链接MySQL数据库&#xf…

44-7145-55控制器模块

44‑7145‑55 控制器模块是一种工业或设备控制系统中的电子模块&#xff0c;主要作用是在现场设备和主控制器之间处理信号。功能和作用输入信号采集接收来自按钮、开关、传感器等的数字或模拟信号。对信号进行滤波、去抖动或状态转换&#xff0c;保证主控制器读取可靠。输出信号…

@RestController注解

1. 引言 在现代的Java Web开发中&#xff0c;Spring框架因其简洁、高效和强大的功能而受到广泛欢迎。Spring MVC是Spring框架的一个重要组成部分&#xff0c;用于构建Web应用程序。RestController注解是Spring MVC提供的一个关键注解&#xff0c;用于简化RESTful Web服务的开发…

0-073-0030-0可编程控制器

0‑073‑0030‑0 可编程控制器是一种工业自动化控制装置&#xff0c;属于可编程逻辑控制器&#xff08;PLC&#xff09;。它通过程序控制系统中输入信号的采集、逻辑处理以及输出信号的控制&#xff0c;实现对机械或设备的自动化管理。功能和作用输入采集接收来自开关、按钮、传…

5分钟快速搭建一个 SpringBoot3 + MyBatis-Plus 工程项目

环境 idea 2023.3.5 jdk 17 mysql 8 创建SpringBoot工程 创建SpringBoot工程&#xff0c;这里有两种方式可选&#xff0c;一种是使用idea提供的Spring Initializr自动创建&#xff0c;一种是通过Maven Archetype手动创建 自动创建SpringBoot工程 使用Spring Initializr创建&…

CES 2026最酷笔记本电脑:可拆卸设计成为新趋势

未来的笔记本电脑可能会拥有更长的使用寿命。AMD、Intel和高通在CES 2026上分别发布了新款移动处理器&#xff0c;将为今年的下一代笔记本电脑提供动力&#xff0c;承诺带来更好的CPU性能、更强的图形处理能力、改进的AI功能和更长的电池续航。这些新芯片将应用于各种类型的笔记…

3BSE022366R1通信接口模块

3BSE022366R1 通信接口模块是 ABB 自动化控制系统中的一款通信单元&#xff0c;主要用于控制器与现场设备或分布式 I/O 之间的数据通信&#xff0c;属于系统里的关键“通信桥梁”。核心作用系统通信接口连接主控制器&#xff08;PLC / DCS&#xff09;与远程 I/O、驱动器、仪表…