大语言模型学习

大语言模型发展历程

当前国内外主流LLM模型

一、国外主流LLM

  1. LLaMA2

    • Meta推出的开源模型,参数规模涵盖70亿至700亿,支持代码生成和多领域任务适配‌57。
    • 衍生版本包括Code Llama(代码生成优化)和Llama Chat(对话场景)‌56。
  2. GPT系列(GPT-3.5/GPT-4)

    • OpenAI开发的闭源模型,以多模态能力和长文本生成为核心优势,广泛应用于对话、代码生成等场景‌38。
  3. BLOOM

    • 由Hugging Face联合多国团队开发,1760亿参数,支持46种自然语言和13种编程语言,强调透明度和开源协作‌5。
  4. PaLM & Claude

    • Google的PaLM和Anthropic的Claude均为闭源模型,前者侧重科学计算,后者强化了推理和多模态能力‌37。
  5. BERT

    • Google早期基于Transformer架构的模型,虽参数较小(约3.4亿),但在自然语言理解任务中仍具影响力‌5。

二、国内主流LLM

  1. 文心一言(ERNIE Bot)

    • 百度研发的知识增强模型,融合万亿级数据和千亿级知识图谱,支持复杂问答和创意生成‌37。
  2. 通义千问

    • 阿里巴巴推出的开源模型(7B版本),基于Transformer架构,优化中英文混合任务处理‌36。
  3. ChatGLM系列

    • 包括ChatGLM-6B(62亿参数)和ChatGLM2-6B,支持双语对话,通过量化技术降低部署成本‌14。
    • 衍生模型VisualGLM-6B(78亿参数)整合视觉与语言模态,实现图文交互‌46。
  4. 盘古大模型

    • 华为开发的多模态模型,覆盖自然语言处理(NLP)、计算机视觉(CV)及科学计算领域‌7。
  5. MiLM-6B

    • 小米研发的64亿参数模型,在C-Eval和CMMLU中文评测中表现优异,尤其擅长STEM科目‌1。
  6. MOSS

    • 支持中英双语的开源对话模型,通过强化学习优化生成质量,适用于通用问答场景‌14。

三、其他特色模型

  • CodeFuse-13B‌:专精代码生成,预训练数据覆盖40+编程语言,HumanEval评测准确率达37.1%‌1。
  • 鹏程·盘古α‌:中文预训练模型,参数规模达千亿级,侧重长文本生成和领域适配‌6。
  • LaWGPT‌:基于中文法律知识微调的模型,适用于法律咨询和文书生成‌6。

大模型不足

当前大模型的不足主要体现在以下方面:

一、技术架构缺陷

  1. 数据与算力依赖过高
    大模型训练需消耗海量多模态数据及算力,万亿级参数规模导致资源投入呈指数级增长‌12。此外,海量小文件存储面临元数据管理挑战,需平衡扩展性与访问延时‌1。

  2. 逻辑推理能力薄弱
    在处理需逻辑推理、数值计算的复杂问题时表现较差,尤其在多步骤推理场景中准确率显著下降‌23。例如20步推理后准确率可能低于36%‌4。

  3. 灾难性遗忘与无记忆性
    训练新任务会损害原有任务性能,且在推理阶段无法记忆历史数据或场景(如自动驾驶需反复重新计算路况)‌23。多数大模型不具备持续记忆能力,依赖有限上下文窗口‌38。


二、知识与应用局限

  1. 知识时效性与领域局限
    大模型知识库仅覆盖训练数据截止时间点内容,无法实时更新‌5。同时缺乏特定领域(如企业私有数据)的专业知识,影响垂直场景应用效果‌5。

  2. 幻觉问题频发
    生成内容存在事实性错误或虚构信息,例如伪造参考文献、错误解答数学题等。这与基于概率预测的Transformer架构特性直接相关‌45。


三、模型可控性不足

  1. 自我纠错能力缺失
    无法识别错误来源(如训练数据缺陷或算法漏洞),更缺乏自主修正机制。典型案例包括GPT-4算术错误后无法定位问题根源‌23。

  2. 黑箱模型可解释性差
    决策过程不透明,导致医疗、法律等关键领域应用受限。调试困难进一步加剧优化挑战‌46。


四、资源与安全风险

  1. 计算成本高昂
    训练与部署需超大规模算力支持,对普通机构形成技术壁垒‌16。

  2. 数据偏见与标注错误
    训练数据隐含社会偏见可能被放大,人工标注错误易导致模型认知偏差‌6。

AIGC产业解析

AIGC基础层

算力基础 数据基础 算法基础

AIGC大模型层

通用基础大模型  行业垂直型基础大模型 业务垂直基础大模型

AIGC工具层

AI Agents 模型平台 模型服务 AutoGPT LangChain

AIGC应用层

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/72387.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3dsmax烘焙光照贴图然后在unity中使用

效果预览 看不清[完蛋!] 实现步骤 使用 软件 软体名称地址photoshophttps://www.adobe.com/products/photoshop.htmlunity3Dhttps://unity.com/3dsmaxhttps://www.autodesk.com.cn/products/3ds-max/free-trialpacker-iohttps://www.uv-packer.com/HDR 贴图地址…

P8651 [蓝桥杯 2017 省 B] 日期问题--注意日期问题中2月的天数 / if是否应该连用

P8651 [P8651 [蓝桥杯 2017 省 B] 日期问题--注意日期问题中2月的天数 / if是否应该连用 题目 分析代码 题目 分析 代码中巧妙的用到3重循环,完美的解决了输出的顺序问题【题目要求从小到大】 需要注意的是2月的值,在不同的年份中应该更新2月的值 还有…

android 横竖屏适配工作总结

1、创建一个横屏文件夹,复制一份竖屏的布局。然后修改适配横屏。只要布局id都有,其他想怎么改就怎么修改。 2、最好使用kotlin语言编写和使用viewBinding绑定控件,可以使用?.判空控件是否存在,不至于缺少这个控件时候直接崩溃。 …

VS2022远程调试Ubuntu中的C++程序

前言 最近想基于星火大模型的SDK开发第一些应用。但是,发现星火的SDK当中Linux版本的比较丰富,Windows 版本支持的比较少。但是,从调试的IDE而言,Visual Studio又是最方便的。所以,考虑采用Visual Studio Ubuntu的形式…

VS Code(Cursor)远程开发调试教程(超详细)

前言 📢 声明:本文配置及开发方法同样适合Cursor !! 在开始之前,你需要准备以下东西: 本地电脑: 安装好 VS Code(Windows、Mac 或 Linux 都可以)。 官网下载&#xff0c…

【C++】类与对象:深入理解默认成员函数

类与对象:深入理解默认成员函数 引言1、默认成员函数概述2、构造函数与析构函数2.1 默认构造函数2.2 析构函数 3、拷贝控制成员3.1 拷贝构造函数3.2 赋值运算符重载 4、移动语义(C11)4.1 移动构造函数4.2 移动赋值运算符 5、三五法则与最佳实…

QT实现计算器

1:在注册登录的练习里面, 追加一个QListWidget 项目列表 要求:点击注册之后,将账号显示到 listWidget上面去 以及,在listWidget中双击某个账号的时候,将该账号删除 Widget.h #ifndef WIDGET_H #define…

算法进阶——二分

二分法: 一种高效查找方法,将问题搜索范围一分为二,迭代地缩小范围,直到找到目标。 二分法适用于有序的数据集合。 常见的二分类型有: 整数二分 浮点二分 二分答案 二分解题步骤: 1.研究并发现数据…

Kotlin函数式编程与Lambda表达式

Kotlin函数式编程与Lambda表达式 一、函数式编程基础 1.1 什么是函数式编程 函数式编程是一种编程范式,它将计算过程视为数学函数的求值,强调使用不可变数据和纯函数。在Kotlin中,函数式编程的特性让我们能够写出更简洁、更易维护的代码。…

Java 并行流(parallelStream)详解

目录 1. 什么是 parallelStream?2. parallelStream 的优势3. parallelStream 的使用3.1 基本使用3.2 计算总和示例3.3 结合groupingByConcurrent实现线程安全的分组操作 4. parallelStream 的注意事项4.1 适用场景4.2 并行流的局限性 5. 控制并行流线程数6. 总结 1.…

Ubuntu 20.04下配置VSCode以支持OpenCV库开发

Ubuntu 20.04下配置VSCode以支持OpenCV库开发 1. 安装OpenCV库安装OpenCV(推荐使用APT安装)或者从源码安装OpenCV(可选) 2. 安装VSCode的C扩展3. 配置c_cpp_properties.json4. 编写代码并测试5. 配置tasks.json(编译Op…

io学习----->标准io

思维导图: 一.io的作用 io是实现对文件的操作,把运行结果存到文件中,读取文件的数据,方便后期查询。 二.io的概念 io是指系统 和外部设备或用户之间的数据交互 I:input 表示数据从外部设备输入到内存中; O:output…

使用消息队列怎样防止消息重复?

大家好,我是君哥。 使用消息队列时,我们经常会遇到一个可能对业务产生影响的问题,消息重复。在订单、扣款、对账等对幂等有要求的场景,消息重复的问题必须解决。 那怎样应对重复消息呢?今天来聊一聊这个话题。 1.三…

005 公网访问 docker rocketmq

文章目录 创建自定义网络创建NameServer容器创建Broker容器正式开始启动 Nameserver 容器启动 Broker 容器并关联 Nameserverdocker exec -it rmqbroker vi /etc/rocketmq/broker.conf检查 namesrv 解析检查 Broker 注册状态Nameserver 日志Broker 日志检查容器日志手动指定 Br…

解决Docker Desktop启动后Docker Engine stopped问题

一、问题描述 当我们更新了Docker Desktop后,在重新打开就显示【Docker Engine stopped(Docker引擎已经停止)】,无法正常使用Docker,如下图所示: 二、问题分析 1、检查电脑主板的CPU是否开启虚拟化; 2、需检查Docker所需的功能是否开启; 3、检查WSL是否匹配; Docker的…

MongoDB—(一主、一从、一仲裁)副本集搭建

MongoDB集群介绍: MongoDB 副本集是由多个MongoDB实例组成的集群,其中包含一个主节点(Primary)和多个从节点(Secondary),用于提供数据冗余和高可用性。以下是搭建 MongoDB 副本集的详细步骤&am…

C++STL---<limits>

C <limits> 头文件&#xff1a; <limits> 头文件是 C 标准库中用于获取各种数据类型的数值范围、精度等信息的工具。它通过模板类 std::numeric_limits 提供了对基本数据类型&#xff08;如 int、float、double 等&#xff09;的详细属性查询功能。通过 std::nume…

蓝桥杯自我复习打卡

总复习&#xff0c;打卡1. 一。排序 1。选段排序 太可恶了&#xff0c;直接全排输出&#xff0c;一个测试点都没过。 AC 首先&#xff0c;这个【l,r】区间一定要包含p,或者q&#xff0c;pq一个都不包含的&#xff0c;[l,r]区间无论怎么变&#xff0c;都对ans没有影响。 其次&…

Flutter_学习记录_实现列表上拉加载更多的功能

可以用ScrollController组件来实现这样列表上拉加载更多的功能: 1. 定义变量 在StatefulWidget 的组件内&#xff0c;添加三个属性&#xff1a; // 滚动视图的控制器final ScrollController _scrollController ScrollController();// 是否已显示了上拉加载中bool _isShowM…

【Linux】【网络】不同子网下的客户端和服务器通信其它方式

【Linux】【网络】不同子网下的客户端和服务器通信其它方式 那么&#xff0c;在 NAT 环境下&#xff0c;应该如何让内网设备做为服务器&#xff0c;使内网设备被外部连接&#xff1f; 1 多拨 部分运营商&#xff0c;支持在多个设备上&#xff0c;通过 PPPoE 登录同一个宽带账…