[特殊字符] 人工智能大模型之开源大语言模型汇总(国内外开源项目模型汇总) [特殊字符]

Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。

所谓 "语言模型",就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 (prompt),自动生成符合这些规律的内容。

LLM 通常基于神经网络模型,使用大规模的语料库进行训练,比如使用互联网上的海量文本数据。这些模型通常拥有数十亿到数万亿个参数,能够处理各种自然语言处理任务,如自然语言生成、文本分类、文本摘要、机器翻译、语音识别等。

本文对国内外公司、科研机构等组织开源的 LLM 进行了全面的整理。


🌍 1. 开源中文 LLM

🔹 ChatGLM-6B —— 双语对话语言模型

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

特点:

  • 支持中英双语问答

  • 优化中文理解与生成

  • 低显存需求,适合本地部署

🔗 GitHub


🔹 ChatGLM2-6B —— 中英双语对话模型第二代

基于 ChatGLM 初代模型的开发经验,ChatGLM2-6B 全面升级了基座模型,支持更长的上下文,更高效的推理,更开放的协议。

升级点:

  • 更长的上下文支持

  • 更快的推理速度

  • 更开放的协议

🔗 GitHub


🔹 VisualGLM-6B —— 多模态对话语言模型

VisualGLM-6B 是一个支持 图像、中文和英文 的多模态对话语言模型,语言模型基于 ChatGLM-6B,视觉部分通过训练 BLIP2-Qformer 构建起视觉与语言的桥梁。

特点:

  • 支持图像+文本多模态输入

  • 78亿参数,增强视觉理解能力

🔗 GitHub


🔹 MOSS —— 支持中英双语的对话大语言模型

MOSS 是一个支持中英双语和多种插件的开源对话语言模型,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100/A800 或两张 3090 显卡运行。

特点:

  • 支持插件增强

  • 在千亿级中英文数据上预训练

  • 适用于多轮对话

🔗 GitHub


🔹 DB-GPT —— 数据库大语言模型

DB-GPT 是一个开源的以 数据库为基础 的 GPT 实验项目,使用本地化的 GPT 大模型与数据和环境进行交互,无数据泄露风险,100% 私密

特点:

  • 专为数据库场景优化

  • 支持本地部署,数据安全可控

🔗 GitHub


🔹 CPM-Bee —— 中英文双语大语言模型

CPM-Bee 是一个 完全开源、允许商用 的百亿参数中英文基座模型,采用 Transformer 自回归架构,使用 万亿级高质量语料 进行预训练。

特点:

  • 开源可商用

  • 中英双语性能优异

  • 超大规模训练数据

🔗 GitHub


🔹 LaWGPT —— 基于中文法律知识的大语言模型

LaWGPT 是一系列基于 中文法律知识 的开源大语言模型,在通用中文基座模型的基础上扩充法律领域专有词表,增强法律语义理解能力。

特点:

  • 法律领域优化

  • 支持司法考试数据集

🔗 GitHub


🔹 伶荔 (Linly) —— 大规模中文语言模型

Linly 是目前最大的中文 LLaMA 模型之一(33B),支持 中文增量训练,并提供量化推理框架。

特点:

  • 支持 CPU/GPU 推理

  • 提供 7B、13B、33B 版本

🔗 GitHub


🔹 Chinese-Vicuna —— 基于 LLaMA 的中文大语言模型

Chinese-Vicuna 是一个中文低资源的 LLaMA + LoRA 方案,支持 CPU 推理

特点:

  • 低成本微调方案

  • 支持 C++ CPU 推理

🔗 GitHub


🔹 ChatYuan —— 对话语言大模型

ChatYuan 是一个支持中英双语的功能型对话语言大模型,最低仅需 400M 显存(INT4) 即可运行。

特点:

  • 轻量化,适合移动端

  • 优化指令理解

🔗 GitHub


🔹 华佗 GPT —— 开源中文医疗大模型

HuatuoGPT(华佗 GPT)是开源中文医疗大模型,基于 医生回复 + ChatGPT 数据 训练,提供丰富的医疗问诊能力。

特点:

  • 医疗领域优化

  • 支持诊断建议

🔗 GitHub


🔹 本草 (BenTsao) —— 基于中文医学知识的 LLaMA 微调模型

本草(原名华驼)是基于 中文医学知识 的 LLaMA 微调模型,适用于医疗问答。

特点:

  • 医学指令微调

  • 支持知识图谱

🔗 GitHub


🔹 鹏程·盘古α —— 中文预训练语言模型

「鹏程·盘古α」是业界首个 2000 亿参数 的中文预训练生成语言模型,支持知识问答、阅读理解等任务。

特点:

  • 超大规模训练

  • 支持少样本学习

🔗 GitHub


🔹 悟道 —— 双语多模态大语言模型

“悟道” 是 1.75 万亿参数 的双语多模态预训练模型,涵盖 文本、图像、蛋白质 等多个领域。

子模型:

  • CogView(文生图)

  • BriVL(图文检索)

  • GLM(英文预训练)

  • CPM(中文生成)

🔗 GitHub


🔹 BBT-2 —— 120 亿参数大语言模型

BBT-2 是包含 120 亿参数 的通用大语言模型,衍生出 代码、金融、文生图 等专业模型。

衍生模型:

  • BBT-2-12B-TC-001(代码模型)

  • BBT-2-12B-TF-001(金融模型)

  • BBT-2-12B-Fig(文生图)

🔗 GitHub


🔹 BELLE —— 开源中文对话大模型

BELLE 目标是促进 中文对话大模型 开源社区的发展,基于 BLOOM 优化中文能力。

特点:

  • 使用 ChatGPT 生成数据微调

  • 支持个性化训练

🔗 GitHub


🔹 TigerBot —— 多模态大语言模型

TigerBot 是一个多语言多任务的大规模语言模型,TigerBot-7B 达到 OpenAI 同规模模型的 96% 性能

特点:

  • 支持多语言

  • 高性能推理

🔗 GitHub


🔹 YuLan-Chat —— 大语言对话模型

中国人民大学发布的 中英文双语对话模型,优化指令微调技术。

特点:

  • 学术研究导向

  • 支持多轮交互

🔗 GitHub


🔹 百聆 (BayLing) —— 中英双语大语言模型

中国科学院计算技术研究所开发的 中英双语大语言模型,性能达 ChatGPT 90%。

特点:

  • 优越的中英生成能力

  • 支持多轮交互

🔗 GitHub


🌎 2. 开源国际 LLM

🔹 通义千问-7B (Qwen-7B) —— 阿里云开源大模型

Qwen-7B 基于 Transformer 架构,支持 8K 上下文,覆盖多种 NLP 任务。

特点:

  • 大规模预训练数据(2.2 万亿 token)

  • 支持插件调用

🔗 GitHub


🔹 Code Llama —— 基于 Llama 2 的 AI 代码生成模型

Meta 发布的 代码生成大模型,支持 Python、C++、Java 等编程语言。

版本:

  • Code Llama(基础代码模型)

  • Code Llama-Python(Python 优化)

  • Code Llama-Instruct(指令理解)

🔗 GitHub


🔹 MiLM-6B —— 小米 AI 大模型

小米开发的 64 亿参数 中文大模型,在 C-Eval 和 CMMLU 评测中表现优异。

特点:

  • 中文优化

  • 高性能推理

🔗 GitHub


🔹 LLaMA —— Meta 开源大语言模型

Meta 的 LLaMA 系列(7B/13B/33B/65B),性能超越 GPT-3。

特点:

  • 高效推理

  • 适合本地部署

🔗 GitHub


🔹 Falcon —— 阿联酋开源语言模型

Falcon 40B 是目前 最强大的开源语言模型之一,性能优于 LLaMA。

特点:

  • 400 亿参数

  • 高效推理

🔗 GitHub


🔹 Vicuna —— 基于 LLaMA 的微调模型

Vicuna-13B 达到 ChatGPT 90% 的质量,训练成本仅 300 美元

特点:

  • 低成本微调

  • 高性能对话

🔗 GitHub


🔹 BLOOM —— 1760 亿参数多语言模型

BLOOM 支持 46 种自然语言 + 13 种编程语言,完全开源。

特点:

  • 多语言支持

  • 免费商用

🔗 GitHub


🔹 GPT-J —— 60 亿参数开源模型

GPT-J 基于 GPT-3 架构,性能接近 OpenAI 的 67 亿参数版本。

特点:

  • 完全开源

  • 支持代码生成

🔗 GitHub


🔹 WizardLM —— 基于 LLaMA 的微调模型

WizardLM 使用 Evol-Instruct 方法自动生成训练数据,优化指令理解。

特点:

  • 70K 指令微调

  • 高性能对话

🔗 GitHub


🛠️ 3. LLM 相关工具

🔹 OpenLLM —— 大语言模型操作平台

支持 Fine-tune、Serve、部署、监控 任何 LLM,兼容多种开源模型。

特点:

  • 支持 RESTful API

  • 简化部署

🔗 GitHub


🔹 LangChain —— 构建 LLM 应用的工具

提供 Prompt 管理、LLM 接口、文档加载、链式调用 等功能。

特点:

  • 支持多种 LLM

  • 灵活构建 AI 应用

🔗 GitHub


🔹 JARVIS —— 连接 LLM 和 AI 模型的协作系统

由 LLM 作为控制器,调用 HuggingFace 模型执行任务。

工作流程:

  1. 任务规划

  2. 模型选择

  3. 任务执行

  4. 生成响应

🔗 GitHub


🔹 Dify —— LLMOps 平台

可视化编排 Prompt、数据集、API,支持 GPT-3/4、LLaMA 等模型。

特点:

  • 开箱即用

  • 支持私有化部署

🔗 GitHub


🔹 Flowise —— 可视化构建 LLM 应用

基于 LangChain 的低代码工具,支持对话链、记忆代理等。

特点:

  • 拖拽式 UI

  • 快速原型开发

🔗 GitHub


🎉 总结

本文整理了 国内外 50+ 开源大语言模型及相关工具,涵盖:

  • 中文 LLM(ChatGLM、MOSS、DB-GPT 等)

  • 国际 LLM(LLaMA、Falcon、BLOOM 等)

  • LLM 工具(LangChain、Dify、Flowise 等)

无论是 学术研究 还是 商业应用,这些开源项目都提供了强大的支持! 🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/78449.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文章记单词 | 第60篇(六级)

一,单词释义 liar:英 [ˈlaɪə(r)];美 [ˈlaɪər];n. 说谎者verbal:英 [ˈvɜːbl];美 [ˈvɜːrbl];adj. 言语的;文字的;口头的;动词的comprehension&…

AI日报 · 2025年04月30日|OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题

过去24小时,全球人工智能领域持续快速发展。从模型行为调整到平台工具更新,再到行业安全规范的探讨,以下是为您精选的重点动态: 1、OpenAI 回滚 GPT-4o 更新以解决“谄媚”问题 针对用户反馈最新版 GPT-4o 模型表现出过度“谄媚…

Linux54 源码包的安装、修改环境变量解决 axel命令找不到;getfacl;测试

始终报错 . 补充链接 tinfo 库时报错软件包 ncurses-devel-5.9-14.20130511.el7_4.x86_64 已安装并且是最新版本 没有可用软件包 tinfo-devel。 无须任何处理 make LDLIBS“-lncurses"报错编译时报错make LDLIBS”-lncurses" ? /opt/rh/devtoolset-11/roo…

FPGA----基于ZYNQ 7020实现EPICS通信系统

1、本实验过程来自博b站大神《神电测控》,原文地址: EPICS实战(上位机篇):基于LV ZYNQ实现的EPICS通信系统(大物理) - 哔哩哔哩https://www.bilibili.com/opus/933476043369480224EPICS实战(下位机篇):基于LV ZYNQ实现的EPICS通信…

实验四 增强型可靠文件传输系统

一、实验目的和任务 掌握基于队列的多文件传输机制理解断点续传的实现原理学习文件传输完整性保障方法 二、实验内容 基础功能验证 单文件传输功能测试服务器状态监控测试传输日志记录验证 新增功能实现 多文件队列传输功能断点续传支持 三、实验步骤 4.1 客户端功能扩…

网络Tips20-003

1.E1载波的控制开销占2/32*100%6.25%,E1载波的基本帧传送时间是125uS。 2.计算机在一个指令周期的过程中,为从内存读取指令操作码,首先要将.程序计数器(PC)的内容送到地址总线上 3.3DES算法:密码学中,3DES是三重数据加密算法通称…

【MySQL】索引(重要)

目录 一、索引本质: 索引的核心作用 索引的优缺点 二、预备知识: 硬件理解: 软件理解: MySQL与磁盘交互基本单位: 三、索引的理解: 理解page: 单个page: 多个page&#x…

【深入浅出MySQL】之数据类型介绍

【深入浅出MySQL】之数据类型介绍 MySQL中常见的数据类型一览为什么需要如此多的数据类型数值类型BIT(M)类型INT类型TINYINT类型BIGINT类型浮点数类型float类型DECIMAL(M,D)类型区别总结 字符串类型CHAR类型VARCHAR(M)类型 日期和时间类型enum和set类型 …

数字化时代下,软件测试中的渗透测试是如何保障安全的?

在如今数字化与信息化的时代,软件测试中存在渗透测试,其位置十分重要,它借助模拟恶意攻击的方式,去发现软件系统所存在的漏洞以及安全问题,这是保障软件安全的关键环节,接下来我会对它的各个方面进行详细介…

Pytorch - Developer Notes 1/2

文章目录 自动混合精度示例典型的混合精度训练处理未缩放梯度梯度裁剪 处理缩放梯度梯度累积梯度惩罚 处理多个模型、损失函数和优化器多 GPU 工作环境下的注意事项单进程中的DataParallel分布式数据并行:每个进程对应一个GPU每个进程使用多块GPU的DistributedDataP…

RuntimeError: CUDA error: __global__ function call is not configured

表明在 CUDA 设备上调用的核函数 没有正确配置线程块和网格维度。 一般体现在: 直接调用 kernel 函数,而不是通过 launch 函数 指定 kernel 函数调用 解决方法(示例): // kernel function __global__ void Idtest_k…

cloudfare+gmail 配置 smtp 邮箱

这里介绍有一个域名后,不需要服务器,就可以实现 cloudfare gmail 的 邮箱收发。 为什么还需要 gmail 的 smtp 功能,因为 cloudfare 默认只是对 email 进行转发,就是只能收邮件而不能发送邮件,故使用 gmail 的功能来进…

如何在 CentOS 7 命令行连接 Wi-Fi?如何在 Linux 命令行连接 Wi-Fi?

如何在 CentOS 7 命令行连接 Wi-Fi?如何在 Linux 命令行连接 Wi-Fi? 摘要 本教程覆盖如何在多种 Linux 发行版下通过命令行连接 Wi-Fi,包括: CentOS 7、Ubuntu、Debian、Arch Linux、Fedora、Alpine Linux、Kali Linux、OpenSU…

基于PHP的在线编程课程学习系统

有需要请加文章底部Q哦 可远程调试 基于PHP在线编程课程学习系统 一 介绍 在线编程课程学习系统基于原生PHP开发,数据库mysql,前端jquery.js。系统角色分为学生,教师和管理员。(附带参考设计文档) 技术栈:phpmysqljquery.jsphps…

PyTorch_张量形状操作

搭建模型时,数据都是基于张量形式的表示,网络层与层之间很多都是以不同的shape的方式进行表现和运算。 对张量形状的操作,以便能够更好处理网络各层之间的数据连接。 reshape 函数的用法 reshape 函数可以再保证张量数据不变的前提下改变数…

大模型实践:图文解锁Ollama在个人笔记本上部署llm

使用在线模型服务时,我们常常需要支付API调用费用,这对于个人开发者或小型组织来说可能是一笔不小的开支。那么,有没有方法可以在本地免费使用这些强大的模型呢?答案是肯定的——Ollama就是这样一个工具。 当然如果是比较大的组织…

Python基本语法(lambda表达式)

lambda表达式 lambda的一般形式是在关键字lambda后面跟一个或多个参数,之后再紧跟一个 冒号,接下来是一个表达式。lambda是一个表达式,而不是一个语句,它能够出现 在Python语法不允许def出现的地方。作为表达式,lambd…

【MySQL数据库】用户管理

目录 1,用户信息 2,创建/删除/修改用户 3,数据库的权限 MySQL数据库安装完之后,我们最开始时使用的都是 root 用户,其它用户通常无法进行操作。因此,MySQL数据库需要对用户进行管理。 1,用户…

Python的ArcPy基于Excel表格对大量遥感影像批量重分类

本文介绍基于Python中的ArcPy模块,以Excel表格内的信息,对遥感影像加以重分类的方法。 首先,明确一下本文的需求。现有按照文章ArcPy批量将栅格文件的属性表导出为Excel表格的方法(https://blog.csdn.net/zhebushibiaoshifu/artic…

LabVIEW 中VI Server导出 VI 配置

该 LabVIEW VI 展示了在 VI Server 中配置和执行 Exported VIs 的过程,实现对服务器端导出 VI 的远程调用与操作。 ​ 具体过程及模块说明 前期配置:需确保在 LabVIEW 的 “Tools> Options > VI Server > Protocols” 路径下,启用 …