实用指南:探索大语言模型(LLM): 大模型应用与对应的硬件选型一览表
2025-11-09 11:52 tlnshuju 阅读(0) 评论(0) 收藏 举报大模型应用与硬件怎么选?看这几张表就够了
一、先认识常见的NVIDIA显卡系列
不同系列的显卡,适合的人群和做的事不一样,看下面的表就清楚啦。
| 系列 | 主要能干啥 | 适合谁用 |
|---|---|---|
| RTX | 面向普通用户,能打游戏、做图形渲染,也能搞点简单的人工智能学习任务 | 游戏玩家、AI 初学者 |
| A 系列 | 性能很强,适合大规模人工智能模型的训练和推理 | 数据中心、AI 研究团队 |
| A800 | 是 A 系列专门为中国市场做的,性能稍低,但符合中国市场需求 | 中国市场搞大模型训练和推理的 |
| H 系列 | NVIDIA 的高端显卡,能支持超大模型(像 GPT - 3/4 这种)的训练 | 超大规 AI 项目、HPC 任务 |
| H800 | H 系列专门为中国市场做的,性能稍低,适合中国市场 | 中国市场搞大模型训练和推理的 |
| L 系列 | 专业做图形和推理的显卡,适合数据可视化和简便的推理任务 | 数据分析师、工作站用户 |
| T 系列 | 入门级显卡,功耗低,适合推理和虚拟化任务 | 节能型数据中心、云服务 |
二、大模型推理时的硬件选择
大模型部署后回答障碍的过程,不同大小、精度的模型,对显存和显卡要求不同,看表:就是推理就
| 模型尺寸 | 精度 | 显存需求(GB) | 推荐显卡 |
|---|---|---|---|
| 7B | FP16 | 12 | RTX 4080 / RTX 4090 |
| 7B | INT8 | 8 | RTX 4080 / T4 |
| 7B | INT4 | 6 | RTX 4080 / RTX 3060 |
| 7B | INT2 | 4 | RTX 3060 / RTX 4080 |
| 13B | FP16 | 24 | RTX 4090 |
| 13B | INT8 | 16 | RTX 4090 |
| 13B | INT4 | 12 | RTX 4090 / RTX 4080 |
| 13B | INT2 | 8 | RTX 4080 / RTX 4090 |
| 30B | FP16 | 60 | A100 (40GB) * 2 |
| 30B | INT8 | 40 | L40 (48GB) |
| 30B | INT4 | 24 | RTX 4090 |
| 30B | INT2 | 16 | T4 (16GB) |
| 70B | FP16 | 120 | A100 (80GB) * 2 |
| 70B | INT8 | 80 | L40 (48GB) * 2 |
| 70B | INT4 | 48 | L40 (48GB) |
| 70B | INT2 | 32 | RTX 4090 |
| 110B | FP16 | 200 | H100 (80GB) * 3 |
| 110B | INT8 | 140 | H100 (80GB) * 2 |
| 110B | INT4 | 72 | A10 (24GB) * 3 |
| 110B | INT2 | 48 | A10 (24GB) * 2 |
三、大模型训练时的硬件选择
训练是让大模型从无到有或变得更好的过程,对硬件要求高,看表:
| 模型尺寸 | 精度 | 显存需求(GB) | 推荐硬件配置 |
|---|---|---|---|
| 7B | AMP | 120 | A100 (40GB) * 3 |
| 7B | FP16 | 60 | A100 (40GB) * 2 |
| 13B | AMP | 240 | A100 (80GB) * 3 |
| 13B | FP16 | 120 | A100 (80GB) * 2 |
| 30B | AMP | 600 | H100 (80GB) * 8 |
| 30B | FP16 | 300 | H100 (80GB) * 4 |
| 70B | AMP | 1200 | H100 (80GB) * 16 |
| 70B | FP16 | 600 | H100 (80GB) * 8 |
| 110B | AMP | 2000 | H100 (80GB) * 25 |
| 110B | FP16 | 900 | H100 (80GB) * 12 |
四、大模型高效微调时的硬件选择
高效微调是在已有大模型基础上,用少量材料适配特定任务,硬件选择更灵活,看表:
| 模型尺寸 | 精度 | 显存需求(GB) | 推荐硬件配置 |
|---|---|---|---|
| 7B | Freeze (FP16) | 20 | RTX 4090 |
| 7B | LoRA (FP16) | 16 | RTX 4090 |
| 7B | QLoRA (INT8) | 10 | RTX 4080 |
| 7B | QLoRA (INT4) | 6 | RTX 3060 |
| 13B | Freeze (FP16) | 40 | RTX 4090 / A100 (40GB) |
| 13B | LoRA (FP16) | 32 | A100 (40GB) |
| 13B | QLoRA (INT8) | 20 | L40 (48GB) |
| 13B | QLoRA (INT4) | 12 | RTX 4090 |
| 30B | Freeze (FP16) | 80 | A100 (80GB) |
| 30B | LoRA (FP16) | 64 | A100 (80GB) |
| 30B | QLoRA (INT8) | 40 | L40 (48GB) |
| 30B | QLoRA (INT4) | 24 | RTX 4090 |
| 70B | Freeze (FP16) | 200 | H100 (80GB) * 3 |
| 70B | LoRA (FP16) | 160 | H100 (80GB) * 2 |
| 70B | QLoRA (INT8) | 80 | H100 (80GB) |
| 70B | QLoRA (INT4) | 48 | L40 (48GB) |
| 110B | Freeze (FP16) | 360 | H100 (80GB) * 5 |
| 110B | LoRA (FP16) | 240 | H100 (80GB) * 3 |
| 110B | QLoRA (INT8) | 140 | H100 (80GB) * 2 |
| 110B | QLoRA (INT4) | 72 | A10 (24GB) * 3 |
简单来说,大模型推理要平衡性能和成本,训练要追求高性能,高效微调更灵活。大家行根据自己的需求,对照上面的表格选硬件~
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/960374.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!相关文章
使用两个体重秤减少体重测量误差
使用两个体重秤减少体重测量误差
问题发现
故事是这样的, 我在PDD花20块大洋买了一个电子体重秤用于测体重, 使用一段时间后发现体重秤可能不准确, 同一时间多次测量每次读数都不相同. 于是又在PDD上花80大洋又买了一个…
2025年知名的密封圈用户口碑最好的厂家榜
2025年知名的密封圈用户口碑最好的厂家榜行业背景与市场趋势密封圈作为工业领域的关键零部件,在航空航天、汽车制造、石油化工、轨道交通等行业发挥着不可替代的作用。根据《2024-2029年中国密封件行业市场调研与投资…
2025年比较好的电加热管高评价厂家推荐榜
2025年比较好的电加热管高评价厂家推荐榜行业背景与市场趋势电加热管作为工业加热领域的关键元件,近年来随着制造业升级和新能源产业发展,市场需求持续增长。据《2024-2025中国电加热元件行业白皮书》显示,2024年全…
2025年口碑好的水泥垫块厂家推荐及选购参考榜
2025年口碑好的水泥垫块厂家推荐及选购参考榜行业背景与市场趋势水泥垫块作为建筑工程中不可或缺的配件,在高铁、桥梁、地铁、隧道等大型工程中发挥着关键作用。根据中国建筑材料联合会最新发布的《2024-2025年中国水…
嵌入式Linux:线程中信号处理 - 详解
pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …
2025年知名的出口蒸笼厂家最新实力排行
2025年知名出口蒸笼厂家最新实力排行:数据解读与采购指南 行业背景与市场趋势
全球竹制蒸笼市场规模在2024年达到23.6亿美元(据Global Market Insights数据),预计2025年将保持6.8%的年增长率。中国作为全球最大…
2025年口碑好的酚醛胶厂家推荐及采购指南
2025年口碑好的酚醛胶厂家推荐及采购指南行业背景与市场趋势酚醛树脂胶粘剂作为重要的工业材料,在木材加工、建筑装饰、汽车制造等领域应用广泛。根据中国胶粘剂工业协会最新统计数据显示,2024年我国酚醛胶市场规模已…
逆向基础--C++数据类型 (02)
逆向基础--C++数据类型 (02)一.介绍使用编程语言进行编程时,需要用到各种变量来存储各种信息。变量保留的是它所存储的值的内存位置。这意味着,当您创建一个变量时,就会在内存中保留一些空间。变量的名称可以由字母…
2025年口碑好的pe实壁缠绕管设备厂家最新热销排行
2025年口碑好的PE实壁缠绕管设备厂家最新热销排行行业背景与市场趋势随着我国城镇化进程加速推进和基础设施建设持续投入,PE实壁缠绕管作为市政排水、工业排污等领域的重要材料,市场需求呈现稳定增长态势。根据中国塑…
2025年知名的甜酒酿用户好评厂家排行
2025年知名的甜酒酿用户好评厂家排行行业背景与市场趋势甜酒酿作为中国传统发酵食品的代表之一,近年来随着消费者对健康食品需求的增长,市场规模持续扩大。据中国食品工业协会最新数据显示,2024年我国甜酒酿市场规模…
ubuntu: apt安装redis
一,安装
# apt install redis
查看状态:
# systemctl status redis.service
● redis-server.service - Advanced key-value storeLoaded: loaded (/usr/lib/systemd/system/redis-server.service; enabled; preset:…
2025年口碑好的PPR给水管设备厂家最新热销排行
2025年口碑好的PPR给水管设备厂家最新热销排行行业背景与市场趋势PPR给水管作为建筑给排水系统中的核心材料,近年来随着我国城镇化进程加速和建筑品质提升需求增长,市场规模持续扩大。据中国塑料加工工业协会最新数据…
高性能场景推荐使用PostgreSQL - 指南
pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …
2025年知名的家具三折轨最新TOP厂家排名
2025年知名的家具三折轨最新TOP厂家排名行业背景与市场趋势随着中国家居制造业的持续升级和消费者对家具品质要求的不断提高,家具五金配件行业迎来了快速发展期。据中国五金制品协会最新数据显示,2024年中国家具五金…
“最小删除步数”错题复盘
“最小删除步数”错题复盘在刷“最小删除步数使两个字符串相等”这道题时,我从“思路跑偏”到“实现全错”,再到“逐步修正”,踩了很多典型坑。这道题看似是简单的字符串操作,实则考察对动态规划(LCS)的理解和题…
两个数组的dp问题 - 实践
pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …
2025年口碑好的异形工业铝型材厂家最新推荐排行榜
2025年口碑好的异形工业铝型材厂家最新推荐排行榜行业背景与市场趋势工业铝型材作为现代工业制造的重要基础材料,在建筑、交通、电子、机械等领域应用广泛。根据中国有色金属工业协会最新数据显示,2024年中国铝型材市…
qemu+linux kernel+busybox搭建linux内核学习环境
前言:里面的知识很多理解的都不到位,不保证正确性,等后期学习好,再来修改。
前提:架构x86_64
一、准备工作sudo apt update
sudo apt install build-essential qemu-system-x86 gdb git flex bison libncurses5-d…
2025年正规的电加热导热油炉厂家选购指南与推荐
2025年正规的电加热导热油炉厂家选购指南与推荐行业背景与市场趋势电加热导热油炉作为工业加热领域的关键设备,近年来随着环保政策趋严和能效标准提升,市场需求持续增长。根据中国锅炉行业协会2024年发布的《工业加热…