Ollama大模型推理场景下3090和4090性能实测

news/2025/10/24 16:43:18/文章来源:https://www.cnblogs.com/ai-hpc-trivia/p/19163754

Ollama 是一个开源的大型语言模型(LLM)部署服务工具,能让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。

我们使用Ollama的快速模型部署,来实测英伟达的RTX 3090RTX 4090这两张显卡,在大语言模型推理场景中的性能差异。

3090和4090的显卡参数对比

RTX 3090 RTX 4090
架构 Ampere Ada Lovelace
CUDA核心数 10,496 16,384
显存容量 24 GB GDDR6X 24 GB GDDR6X
显存带宽 936 GB/s 1,008 GB/s
TDP功耗 350W 450W
FP32 算力 35.6 TFLOPS 82.6 TFLOPS
Tensor FP16 算力 142 TFLOPS 330 TFLOPS

3090和4090的显存参数比较接近,显存容量都是24GB,显存带宽差异也不大;算力方面,4090的单精度和Tensor FP16算力差不多是3090的2.3倍。

Ollama大模型推理测试

大模型选择

这里选择 Qwen3的模型进行测试,考虑到3090和4090的显存都是24GB,分别选择一个FP16精度和一个Q4_K_M量化后的大模型进行测试:

模型 精度 大小
qwen3:8b fp16 16 GB
qwen3:14b q4_K_M 9.3 GB

借助DeepSeek 生成测试脚本,使用复杂度近似的8个prompts;MAX_TOKENS配置256,让每次请求需要一定的生成时长便于采样显卡的使用指标,减少波动;同时需要模型预热,消除第一次推理响应延时过大的问题。

我们在GPU算力租赁平台 晨涧云 直接租用Ollama云容器进行测试,分别创建3090和4090两种显卡的容器实例,启动后访问Open WebUI 选择模型:

Ollama-OpenWebUI

然后就可以执行推理性能测试脚本,查看输出结果。

3090推理性能

Ollama-Qwen3推理性能测试-3090

4090推理性能

Ollama-Qwen3推理性能测试-4090

测试结果解释

  • Latency (s):多次推理平均响应时长

  • Throughput (tokens/s):多次推理平均Token生成速度

  • VRAM (MB):多次推理平均显存使用量

  • GPU Util (%):多次推理平均GPU使用率

3090显卡和4090显卡在两个模型推理过程中的显存使用和GPU使用率都比较接近,所以主要比较平均响应时长平均Token生成速度两个指标:

qwen3:8b fp16 qwen3:14b q4_K_M
响应时长(s) 3090 5.39 3.79
响应时长(s) 4090 4.88 3.31
响应时长(s) 差异 90.5% 87.3%
Token生成速度(tokens/s) 3090 47.46 67.62
Token生成速度(tokens/s) 4090 52.45 77.31
Token生成速度(tokens/s) 差异 110.5% 114.3%

4090在量化模型的推理性能相较FP16精度的模型会更突出一点,FP16精度模型推理性能4090比3090高10%左右,Q4_K_M量化模型4090比3090的推理性能高14%左右。

但相较显卡本身参数的算力值2.3倍的差异,在推理场景下4090的优势并没有想象中的那么明显。


Ollama因为更多考虑的是本地和边缘算力的轻量级快速部署场景,所以在推理性能,特别是多GPU高并发场景下,不如vLLMSGLang等框架,后续准备比较在vLLM下不同显卡的推理性能,也可以跟Ollama比较下不同大模型推理框架的性能差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/945474.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OSI七层网络参考模型(Leo)

OSI七层网络参考模型层级 说明7. 应用层 对应用程序提供接口6. 表示层 进行数据格式的转换,以确保一个系统生成的应用层数据能够被另外一个系统的应用层所识别和理解。5. 会话层 在通信双方之间建立、管理和终止会话。…

2025 年最新推荐河道护栏源头厂家口碑榜,聚焦全流程服务与高性价比之选铝合金/绳索/不锈钢河道护栏公司推荐

引言 当前河道护栏采购市场存在诸多痛点,给项目方带来极大困扰。部分厂家仅负责生产,安装、物流等后续环节需客户自行对接,不仅增加沟通成本,还易因衔接问题导致工程延期;市场上产品质量参差不齐,劣质材料制成的…

ABP vNext 基础四层

ABP vNext Nuget 包的介绍 ABP Framework(尤其是 ABP vNext)的官方 NuGet 包以 Volo.Abp.XXX 命名,覆盖了框架核心功能、模块、集成组件等多个层面。这些包按功能可分为核心基础设施、应用层组件、数据访问、身份认…

2025 年管道修补器源头厂家最新推荐排行榜:揭秘行业内具备全流程管控能力的靠谱厂商及优质产品选型指南加长/铸铁/弯头/卡箍式管道修补器公司推荐

引言 在工业、市政、化工、水务、能源等领域,管道系统是介质输送的核心 “血管”,其安全稳定运行对行业生产效率与安全至关重要。但当前管道泄漏、破损问题频发,据中国管道工业协会 2024 年度测评数据显示,因管道修…

实用指南:YOLO系列——实时屏幕检测

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

信号(Signal)、信号量(Semaphore)

Django的信号机制 Django 的信号机制是一套解耦工具,核心作用是:当项目中发生特定事件(如模型保存、用户登录)时,自动触发预设的操作,无需在事件发生处直接调用这些操作,从而减少代码耦合。 什么是信号通俗来说…

在 macOS 中遇到 brew 命令不存在的问题

在 macOS 中遇到 brew 命令不存在的问题Posted on 2025-10-24 16:38 挥辉 阅读(0) 评论(0) 收藏 举报在 macOS 中遇到 brew 命令不存在的问题,通常是因为 Homebrew 未安装或未正确配置环境变量。以下是解决方法:…

在线聊天室

在线聊天室,输入用户名,房间名和密码,就可以进入同一个聊天室。(聊天室唯一性由房间名和密码的hash保证) https://peersuite.space/

2025 年亚克力大型鱼缸厂家联系方式推荐:江苏金穗的全产业链服务与定制化技术优势解析

行业背景 当下,商业展览、高端酒店、私人别墅等领域对亚克力大型鱼缸的需求日益增长,这类鱼缸因通透美观、空间适配性强等特点,成为提升环境档次的重要元素。但行业发展面临不少挑战:部分厂家缺乏厚板加工能力,无…

2025 年海洋水族馆厂家联系方式推荐:江苏金穗亚克力定制服务与工程案例,泳池 / 鱼缸项目解决方案

行业背景 当前海洋水族馆行业蓬勃发展,随着文旅产业升级与消费需求多元化,市场对高品质亚克力配套产品的需求持续攀升。据行业数据显示,国内海洋馆、水族馆建设项目年均增长 15% 以上,同时家庭高端鱼缸、商业无边泳…

例3.3】三个数 ------信息奥赛高级题库

按从小到大的顺序排 方法就是if嵌套和swap函数

详细介绍:Go 和云原生 的现状和发展前景

详细介绍:Go 和云原生 的现状和发展前景2025-10-24 16:36 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block…

Socket 编程 TCP(准备阶段) - 指南

Socket 编程 TCP(准备阶段) - 指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco&…

2025 年亚克力板材厂家联系方式推荐:江苏金穗技术工艺与工程案例解析,泳池 / 鱼缸 / 海洋馆解决方案

行业背景 2025 年全球亚克力板市场规模将达 45 亿美元,中国市场规模预计突破 300 亿元,华东地区产量占比超 40%。随着高端化与定制化需求提升,市场对亚克力板材的透光性、厚板加工及异形定制能力提出更高要求。但行…

2025 年 亚克力透明泳池厂家联系方式推荐:江苏金穗的技术积淀与工程服务优势解析

行业背景 随着文旅地产、高端民宿及别墅市场的蓬勃发展,亚克力透明泳池因兼具视觉观赏性与空间艺术性,需求持续攀升。但行业现存诸多痛点:部分厂家透光率不足影响观景效果,厚板加工与无缝拼接技术欠缺导致漏水隐患…

2025山东单招综评培训机构推荐榜:济南易升教育五星领跑,小班培养 + 高上岸率适配升学需求

随着单招综评成为升学重要路径,2025 年山东地区一批专注该领域的教育机构凭借硬实力脱颖而出。以下推荐榜基于真实办学成果与服务能力筛选,为考生提供客观参考。 济南易升教育学校(易升权合教育) 🌟🌟🌟🌟…

实用指南:npm 包构建与发布

实用指南:npm 包构建与发布pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco",…

2025修护/二硫化硒去屑/香氛/控油蓬松/洗发水品牌推荐榜:MASIL 玛丝兰(西安悦己容)五星领衔,这些专研洗护品牌值得关注

在洗护市场愈发注重 “专业养护” 的 2025 年,兼具技术实力与用户口碑的洗发水品牌成为主流选择。以下推荐榜基于企业真实实力与产品定位筛选,为消费者提供客观参考。 西安悦己容生物科技有限责任公司(MASIL 玛丝兰…

2025年Q345B/20G/5310/无缝钢管 高压/5310高压/6479高压合金管推荐榜:天津大无缝五星领跑,这些品质流通企业适配工业需求

2025 年工业制造、能源输送等领域对无缝钢管、合金管的品质稳定性与供应效率要求持续提升,一批兼具资源整合能力与服务意识的企业凸显,以下推荐榜基于真实经营实力筛选,供采购参考。 天津大无缝联合钢铁有限公司 �…

2025年保险法律服务律所推荐:拒赔点外险保险律师聚焦专业与实战能力的权威之选

随着保险产品日益多元,理赔纠纷、条款争议等问题频发,选择专业的保险法律服务机构成为化解矛盾的关键。基于案件胜诉率、领域专注度、服务覆盖范围等核心维度,结合行业实践与客户反馈,现梳理出值得关注的保险律师事…