【项目复现上新】Karpathy大神开源GitHub高分项目NanoChat!仅用100美元+8000行代码手搓ChatGPT

news/2025/10/22 11:49:16/文章来源:https://www.cnblogs.com/lab4ai/p/19157605

The best ChatGPT that $100 can buy.

10 月 13 日,AI 领域大神 AndrejKarpathy 发布了自己的最新开源项目。截至当前,​GitHub 项目上已经达到 29.1KStar​。
image.png

nanochat 是什么

nanochat 是 AI 领域专家 AndrejKarpathy 发布的开源项目,该项目包含从数据准备、预训练、中期训练、监督微调(SFT)、强化学习(RL)到推理部署的完整流程,约​8000 行代码​,其以极低成本和高效流程训练小型语言模型,​实现类似ChatGPT 的对话功能​。

AndrejKarpathy 表示,像 nanochat 这样的模型训练成本大概在 100 到 1000 美元之间,而 100 美元级别的模型的参数量只有GPT-3 的千分之一,只需使用 8​​张H100GPU 训练不到 4 小时​,就可以训练出一个能够写故事/诗歌、回答简单问题的模型。

如果将预算增加到​1000 美元​,只需要训练约41.6 小时就能使模型性显著提升,能解决简单数学/代码问题并参与多项选择题测试。
image.png
GitHub 链接​:

https://github.com/karpathy/nanochat

Lab4AI 链接​:

https://www.lab4ai.cn/project/detail?utm_source=jssq_&id=f19f6e05f51a454d82383cc1ba250dde&type=project
| nanochat 的主要功能

虽然代码量只有8000 行,但是它也实现了以下功能:

全新Rust 分词器(Tokenizer)训练​:使用Rust 语言实现训练分词器;

在FineWeb 数据集上预训练​:在FineWeb 数据集上对 Transformer 架构的大语言模型进行预训练,并在多个指标上评估 CORE 分数;

中期训练​:在SmolTalk 用户-助手对话数据集、多项选择题数据集、工具使用数据集上进行中期训练;

监督微调(SFT)​:在世界知识多项选择题数据集(ARC-E/C、MMLU)、数学数据集(GSM8K)、代码数据集(HumanEval)上进行监督微调;

强化学习(RL)优化​:使用“GRPO”算法在 GSM8K 数据集上对模型进行强化学习微调;

高效推理引擎​:实现高效模型推理,支持KV 缓存、简易预填充/解码流程、工具使用(轻量级沙箱环境中的 Python 解释器),并通过 CLI 或类 ChatGPT 的 WebUI 与模型交互;
自动训练总结​:生成单一的Markdown 格式报告卡,总结整个训练推理流程,并以“游戏化”形式展示结果。

一键复现

过去提到LLM 训练,人们脑海里浮现的是动辄上百万美元的算力成本、庞大的研发团队和海量的数据储备,这让个人开发者和中小型团队望而却步;

而nanochat 不仅将​成本压缩至100 美元​,大模型实验室Lab4AI 更通过​“一键体验”模式​,让这个几乎人人可承担的价格真正转化为“人人可操作”的尝试,不再需要纠结环境配置、流程调试,普通人跟着指引就能亲手搭建属于自己的简易版 ChatGPT,这种“​低门槛​+ 易操作”的组合,也恰好解决了学习者“纸上谈兵”的痛点——以往看过无数教程却仍不知全流程如何落地,

如今大模型实验室Lab4AI 推出的 nanochat 体验项目“100 美元实现自己的 ChatGPT”。

提供从数据准备到推理服务的“​一键式”全流程工具链​,学习者​不用再为环境搭建、代码调试耗费精力​,只需跟着引导逐步操作,就能直观感受模型训练的每一个环节,让“无从下手”变成“步步有迹可循”。
image.png
Step1:登录 Lab4AI.cn。

在“项目复现”中找到“​AI 大神 Karpathy 开源 GitHub 高分项目 NanoChat-100 美元手搓 ChatGPT​”。

项目内已经提供完整的复现NanoChat 的全流程代码和环境,您只需配置 8 卡,即可手搓 ChatGPT。
image.png
Step2:环境激活。

系统内已经预置可用的conda 虚拟环境,此环境可满足后续步骤的需要。您只需执行下列脚本安装 Rust/Cargo。
image.png
Step3:模型训练

本次复现中,我们将训练分为pretrain、midtrain 和 SFT 三个阶段。pretrain 阶段约需要 2.5-3 小时,midtrain 阶段约耗时 30 分钟内。

下方为训练时各卡的工作状态。从图中看,8 块 NVIDIAH10080GB 显卡已经全部运行中,几乎吃满了所有的 GPU 算力。

您可以通过监控这些指标,亲眼看到模型是如何被“训练”出来的。
image.png
Step4:模型评估。

每个训练阶段有相应的评估程序输出结构化评估结果。

以下是本次实践的pretrain 后的评估结果,从结果得知:​模型初步掌握了世界运作的基本逻辑​。PIQA(物理互动问答):61.26%,表明模型已经初步掌握了世界运作的基本逻辑。COPA(因果推理):54.00%,表明模型开始具备初步的因果判断能力。Winograd(指代消解):56.04%,表明模型能处理一些简单的句法歧义。

当​面对复杂推理的阅读理解任务能力很弱​。ARCEasy(基础科学问答):45.50%,表明模型掌握了一些基础的科学知识,但还不够牢固。ARCChallenge(挑战科学问答):26.79%,表明模型缺乏深度的、学科性的知识。

面对知识密集型与复杂逻辑任务时,模型表现出了短板​。
Jeopardy!(知识问答):0.90%,

SQuAD(阅读理解):1.59%,

CoQA(对话式问答):4.31%,

OpenBookQA(开卷问答):26.40%。
image.png
Step5:部署推理。

训练完成的模型支持如下两种推理方式:通过命令行的方式进行推理;通过WebUI 的方式进行推理。

(1)通过命令行对话,执行后即可在下方看到推理内容。

image.png
(2)通过WebUI 执行对话。执行代码后,鼠标滑过右上角的【对外服务】,将链接复制到浏览器,打开后即可对话。
image.png

Lab4AI 支撑从研究到落地

Lab4AI 提供除了一键复现之外,还提供更多的价值:

1. 如果你是科研党

每日更新Arxiv 上的论文,支持翻译、导读、分析,帮你快速跟进前沿研究;还能一键复现其他大模型;若你有自己的数据集,能直接在平台上进行代码微调,平台还支持使用 LLaMA-Factory 进行 WebUI 微调大模型,甚至对接投资孵化资源,把科研创意变成落地成果。
image.png
image.png
image.png
2.如果你是学习者

如果你想掌握大模型相关技能,Lab4AI 的优势更明显:​Lab4AI 提供多种在线课程​,更有LLaMA Factory 官方合作课程,让您理论学习和代码实战同时进行。LLaMA Factory 官方合作课程课程聚焦于当下最受欢迎的LLaMA Factory 框架,带您从理论到实践,一站式掌握大模型定制化的核心技能,课程还送 300 元算力、完课证书。
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/943232.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实用指南:Ansible实战:VMware下K8s自动化部署指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

作业三(结对编程)-小学四则运算题目生成与判卷(Python + 可视化)

结对作业:小学四则运算题目生成与判卷(Python + 可视化)姓名/学号:翁广驰(3123004409)、关健佳(3121004072) Github项目地址:https://github.com/Gucvii/homeworkPSP2.1 表格(实现前的预估)(1分)PSP 阶段 预…

2025年10月景区钢丝绳护栏厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析

随着旅游业的蓬勃发展和景区安全标准的持续提升,景区钢丝绳护栏作为关键的安全防护设施,其市场需求呈现稳定增长态势。行业统计数据显示,2024年中国景区防护设施市场规模已突破75亿元,其中钢丝绳护栏凭借其优良的安…

技术 | 在单台电脑上管理多个 GitHub 账户并解决推送问题(测试中)

### 在单台电脑上管理多个 GitHub 账户并解决推送问题>在日常开发中,我们经常需要在同一台电脑上使用多个 GitHub 账户(例如个人账号和工作账号),但默认配置下容易出现推送权限错误或提交记录关联到错误账户的问…

CF2159E

CF2159E 求的是一个: \([x^k]\frac{(ax^2+bx+c)^n}{1-x}\) 可以分块: 对于所有 \(i\leq B\) 的 \((ax^2+bx+c)^i\) 预处理出。 再处理出所有的 \(i=kB\) 的 \(\frac{(ax^2+bx+c)^{i}}{1-x}\), 也就是 \((ax^2+bx+c)…

WebGL/Canvas 内存泄露分析

WebGL/Canvas 内存泄露分析在构建高性能、长周期运行的 WebGL/Canvas 应用(如 3D 编辑器、数据可视化平台)时,内存管理是一个至关重要且极具挑战性的课题。在构建高性能、长周期运行的 WebGL/Canvas 应用(如 3D 编…

2025年10月半封闭滑轨丝杆模组厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析

在工业自动化领域,半封闭滑轨丝杆模组作为精密传动系统的核心部件,其定位精度与运行稳定性直接影响设备整体性能。随着智能制造的深入推进,市场对高精度、高刚性模组产品的需求持续增长。本文基于行业技术参数、产品…

Stable Diffusion启动提示端口错误处理

Windows启动Stable Diffusion报错错误原因,本机IP地址设置错误 修改配置文件为本机地址 文件为 sd-webui-aki-v4.1\.launcher\preference.json修改以下地址为本机地址再次启动即可

k8s部署的milvus提升性能需要扩容的角色节点

increase the number of proxy nodes to accept more requests from the client-side increase the number of query nodes to hold more data in memory to compute increase the number of data nodes to process in…

小程序-定义头部导航

默认定义头部导航,打开小程序自适应移动设备。<page-meta page-style="height:100%"><navigation-bar title="主页" /><view>123</view></page-meta>如需转载原创…

2025年10月简易丝杆模组定制厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析

在工业自动化快速发展的背景下,简易丝杆模组作为精密传动领域的核心部件,其定制化能力与产品质量直接影响设备性能。当前市场需求呈现出对高精度、模块化、快速交付的显著特征,专业定制厂家凭借其技术积累与服务优势…

Golang的 cron 库

目录🔍 Cron 表达式💡 核心特性与用法预定义模式与间隔基本使用步骤时区设置高级选项简单示例⚠️ 版本注意与总结Golang 的 cron 库用于处理定时任务,其中 github.com/robfig/cron/v3 是一个广泛使用的、功能丰富…

poll 函数原理与 TCP 服务器构建详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Android 应用多模块开发时,子模块只有 release buildType 时编译报错怎么办?

非常好的问题 👏,而且你这个需求其实是 最常见、最合理 的做法。 你完全正确 —— 如果你的模块(library modules)只需要 release(正式版)构建,而 app 有多个 buildType(比如 dev, prod 等),你 不需要 在每…

ipad协议对个人微信机器人进行二次开发

ipad协议对个人微信机器人进行二次开发、个微协议,微信号二次开发/ipad协议 优势 我们是一家专业服务企业数字化微信管理服务的技术团队,服务于需求SCRM、机器人、营销系统、社群小助手等具有研发能力的企业,同时我们…

西安交通大学国家级医学公关交叉平台实验室建设实拍图

在西安交通大学创新港,医学板块科研平台建设正以“加速度” 推进。 实验室现场,通风管道改造已完工,崭新的地面和实验台通风柜等实验室家具布局井然有序。

2025年10月智能门窗代理厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析

随着智能家居市场的快速发展,智能门窗行业迎来了快速增长期。据行业统计数据显示,2024年中国智能门窗市场规模预计突破800亿元,年复合增长率保持在18%以上。消费者对智能门窗的需求已从基础功能向智能化、安全性、节…

深入解析:【ROS2学习笔记】话题通信篇:话题通信再探

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Android插件化框架

https://chat.deepseek.com/share/w6duumv7aglpslahak Android插件化框架Shadow深度解析 1. 什么是Android插件化? 1.1 基本概念 Android插件化是一种技术,允许一个已安装的APP(称为宿主)动态加载并运行另一个完整…