从0开始学习大模型--Day01--大模型是什么

初识大模型

在平时遇到问题时,我们总是习惯性地去运用各种搜索引擎如百度、知乎、CSDN等平台去搜索答案,但由于搜索到的内容质量参差不齐,检索到的内容只是单纯地根据关键字给出内容,往往看了几个网页都找不到答案;而如果我们将问题输入大模型,因其拥有非常庞大且高质量的知识储备,比我们直接用搜索引擎找答案方便很多,同时还能识别你所输入问题的细节,比如“不想用某种方法”这类文本的语句,输入大模型后所找到的答案会避开所说的方法。

大模型的演变

人工智能按照技术实现可以分为多个子领域:

人工智能

人工智能是一个广泛涉及计算机科学、数据分析、统计学、机器工程、语言学、神经科学、哲学和心理学等多个领域,说白了就是可以把我们所学习的各种领域的知识在应用时量化,并更好地结合去给出答案。

机器学习

机器学习可分为监督学习(指导分类)、无监督学习(主动聚类)和强化学习(试错),前面两者区别在于是否用带有标签的数据进行训练,而后者则是通过反馈机制让机器自己平衡探索新方法和利用已有经验,最大化奖励次数。

深度学习

深度学习是机器学习的一个分支,主要使用神经网络模型(有多个隐藏层组成),对数据进行学习和表示。

通过对大量数据的学习,自动提取出数据的特征,从而实现图像识别、语音识别、自然语言处理等任务,比如在学习分辨水果过程中,会自动从复杂的信号如视觉、嗅觉等中提取层次化的特征,从而达到识别的目的。

生成式人工智能(AIGC)

生成式人工智能是深度学习中快速增长的子集,其使用了大模型提供支持,在大量原始、未标记的数据基础上对深度学习模型进行预训练,使得机器能够“理解”语言甚至图像,并能够根据需求生成内容。

大模型的使用与训练

使用

我们只需要根据我们的问题向大模型提出需求,就能获得详细的回答,但要注意所提出问题的关键词和方式需要严谨地按照问题来,往往几个字的区别,大模型所理解的意思和给出的答案的方向是截然不同的。

训练

大模型的训练大体分为预训练、SFT(监督微调)以及RLHF(基于人类反馈的强化学习)。

预训练:先学习底层的处理能力和知识,类似于我们在小学到高中的经历,这些经历让我们形成了对事物的认知以及拥有了最基本的处理事情的能力和学习能力;比如我们像大模型询问“埃菲尔铁塔在哪个国家”,其会根据看过的关联类似语句的语料中搜索答案,可能会因为有一个排比诗歌的一句话是“埃菲尔铁塔在哪个国家,东方明珠在哪个国家”而输出“东方明珠在哪个国家”而不是“法国”;

监督微调:相比较预训练,区别在于选择了一个特定的方向或领域去学习所需的知识点和能力,类似于在大学里我们学习某种专业知识以及对应的动手能力。在这个阶段,如果再像大模型提问“埃菲尔铁塔在哪个国家”,他会根据学习过的人类对话的语料以及垂直领域知识,按照人类的意图来回答这个问题,即大概率回答“法国”,但并不一定符合我们认知中的一些偏好,可能会有一些过激或者涉及到种族歧视等的言论;

基于人类反馈的强化学习:就像表面的说法一样,需要根据外界的反馈来判断是否要这么做,类似于在工作时作为一个新人小白,在遇到问题或开始培训时请教已经工作了很久的前辈或专家的经验。在这个阶段中,大模型会根据同一个问题给出不同的回答,人类会对这些回答进行打分,大模型会基于这些分数学习到如何输出分数最高的回答,使回答更符合偏好。

大模型的特点和分类

特点

1、规模和参数量大:大模型通过其庞大的规模来捕获复杂的数据模式,使得其能理解和生成极其丰富的信息;

2、适应性和灵活性强:能过通过微调或少样本学习高效地迁移到各种下游任务,有极强的跨域能力;

3、广泛数据集的训练:使用大量多样化的数据进行训练,以学习广泛的知识表示,能够掌握语言、图像等数据的通用特征;

4、计算资源需求大:巨大的规模带来了高昂的计算和资源需求,包括但不限于数据存储、训练空间、能量消耗和硬件设施

分类

1、大语言模型:专注于自然语言处理(NLP),旨在处理语言、文章、对话等自然语言文本。它们通常基于深度学习架构(如Transformer模型)经过大规模文本数据集训练而成,能够捕捉语言的复杂性,包括语法、语义、语境以及蕴含的文化和社会知识。语言大模型典型应用包括文本生成、问答系统、文本分类、机器翻译、对话系统等;

2、多模态模型(计算机视觉模型、音频处理模型等):多模态大模型能够同时处理和理解来自不同感知通道(如文本、图像、音频、视频等)的数据,并在这些模态之间建立关联和交互。它们能够整合不同类型的输入信息,进行跨模态推理、生成和理解任务。多模态大模型的应用涵盖视觉问答、图像描述生成、跨模态检索:多媒体内容理解等领域。

学习来源于B站教程:【基础篇】04.大模型的工作流程_哔哩哔哩_bilibili

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/79748.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【AI大模型】SpringBoot整合Spring AI 核心组件使用详解

目录 一、前言 二、Spring AI介绍 2.1 Spring AI介绍 2.2 Spring AI主要特点 2.3 Spring AI核心组件 2.4 Spring AI应用场景 2.5 Spring AI优势 2.5.1 与 Spring 生态无缝集成 2.5.2 模块化设计 2.5.3 简化 AI 集成 2.5.4 支持云原生和分布式计算 2.5.5 安全性保障…

洛谷 P9007 [入门赛 #9] 最澄澈的空与海 (Hard Version)

这道题可不入门。 [Problem Discription] \color{blue}{\texttt{[Problem Discription]}} [Problem Discription] 给定 n n n,求有多少组 ( x , y , z ) (x,y,z) (x,y,z) 满足: x − y z n ! x-\dfrac{y}{z}n! x−zy​n! x − y z n ! n \dfrac{x-y…

PostgreSQL 的 pg_stat_file 函数

PostgreSQL 的 pg_stat_file 函数 pg_stat_file 是 PostgreSQL 提供的一个系统管理函数,用于获取文件系统上文件的元数据信息。这个函数对于数据库管理员进行文件级别的监控和诊断非常有用。 一 函数基本语法 pg_stat_file(filename text [, missing_ok boolean …

关于麒麟服务器实现docker-compose服务开机自启

我本地服务器环境是麒麟V10版本: 首先确定docker-compose服务绝对路径命令: which docker-compose我这里输出是:/usr/bin/docker-compose 编辑服务文件: sudo vim /etc/systemd/system/docker-compose-webup.service[Unit] Desc…

基于 jQuery 实现复选框全选与选中项查询功能

在 Web 开发中,复选框是常见的交互元素,尤其是在涉及批量操作、数据筛选等场景时,全选功能和选中项查询功能显得尤为重要。本文将介绍如何使用 HTML、CSS 和 jQuery 实现一个具备全选、反选以及选中项查询功能的复选框组,帮助开发…

AfuseKt2.4.2 | 支持阿里云盘、Alist等平台视频播放,具备自动海报墙刮削功能的强大播放器

AfuseKt是一款功能强大的安卓端在线视频播放器,支持播放阿里云盘、Alist、WebDAV等平台的视频内容。它具备自动海报墙刮削功能,能自动生成影片信息和海报墙,提供良好的视觉体验。此外,它还支持倍速播放、字幕、音轨切换等多种实用…

Netlink在SONiC中的应用

Netlink在SONiC中的应用 Netlink介绍 Netlink 是 Linux 内核态程序与用户空间程序之间进行通信的机制之一,原本是用于传递网络协议栈中的各种控制消息。它采用和套接字(socket)编程接口相同的形式,常用于配置内核网络子系统&…

语音合成之十一 提升TTS语音合成效果:低质量数据清洗、增强与数据扩增

低质量数据清洗、增强与数据扩增 1. 引言:TTS的基石——数据质量2. 基础:TTS数据准备工作流2.1 规划:定义蓝图2.2 执行:从原始数据到训练就绪格式2.3 最佳实践与可复现性 3. 攻克缺陷:低质量语音数据的清洗与增强3.2 手…

Java IO流分类与记忆方法

Java IO流分类与记忆方法 在Java IO流体系中,理解节点流和包装流的区别是掌握IO编程的关键。 一、核心分类标准 1. 节点流(Node Stream) 直接对接数据源:直接连接物理IO设备(文件、网络、内存等)基础功能:提供最基础的读写能力命名特征:通常包含数据源类型名称(如Fi…

架构师如何构建个人IP:职业规划与业务战略的双重提升

在数字化时代,软件架构师的角色已从单纯的技术专家转变为兼具技术领导力和业务影响力的复合型人才。如何构建个人IP,提升行业影响力,成为架构师职业发展的关键课题。本文从个人认知、业务战略、架构决策、产品思维四个维度,探讨架…

vscode运行python的快捷键

以下是一些在 VS Code 中运行 Python 代码的常用快捷键: 运行 Python 文件 Windows/Linux :Ctrl F5。此快捷键会直接运行当前打开的 Python 文件,不会自动进入调试模式。若之前有配置过终端,一般会使用配置好的终端来运行&…

使用OpenCV 和 Dlib 实现疲劳检测

文章目录 引言1.相关技术介绍2. 系统原理2.1 眼睛纵横比(EAR)算法2.2 系统工作流程 3.代码解析3.1 关键函数说明3.2 主循环逻辑 4.实际应用效果5.参数调优建议6.总结 引言 疲劳驾驶是交通事故的主要原因之一。本文将介绍如何使用Python和计算机视觉技术构建一个实时疲劳驾驶检…

VBA实现后入先出(LIFO)库存统计

先入先出(FIFO)比较容易理解,买入早的优先卖出。与之对应的是后人先出(LIFO),就是优先卖出最近买入的,例如:第8行卖出2K,当天还没有买入记录,只能找前一天的买…

Python中的客户端和服务端交互的基本内容

目录 网络协议 网络的通信方式 需要安装的组件和需要导入的包模块 安装的组件 导入包模块 如何创建客户端 如何创建服务端 网络协议 IPV4:是互联网协议的第四版,也是目前广泛使用的网络协议。它使用32位地址格式,理论上可以提供约43亿…

【硬核攻坚】告别CUDA OOM!DeepSeek部署显存瓶颈终极解决方案:三大策略高效落地

目录 引言:大模型落地的“甜蜜”与“烦恼”DeepSeek剖析:为何它如此“吃”显存?CUDA OOM的“幽灵”:现象、根因与诊断破局之道:三大策略驯服显存“猛兽” 策略一:模型量化 - 给模型“瘦身”的艺术策略二:动态优化 - 榨干硬件潜能策略三:分布式扩展 - 集群的力量实战演练…

JavaSE核心知识点01基础语法01-01(关键字、标识符、变量)

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 JavaSE核心知识点01基础语法01-01&#xff0…

【最新Python包管理工具UV的介绍和安装】

介绍 uv是一个非常快的 Python 包安装程序和 pip 解析器,用 Rust 编写,设计为pip-tools的直接替代品。 以下是官网给出的UV与其他包管理工具解决依赖(左)和安装包(右)的对比图。 可以看出UV是一个极快的 P…

麒麟、UOS系统在线打开word文件并提取修订痕迹

麒麟、UOS系统在线打开word文件并提取修订痕迹 查看本示例演示效果(Windows版) 查看本示例演示效果(国产版)本示例关键代码的编写位置,请参考“开始 - 快速上手”里您所使用的开发语言框架的最简集成代码 注意 本文中…

【SpringAI+阿里云百炼】AI对话4个Demo

基于SpringAI和阿里云百炼平台,实现了四个AI对话的小Demo 小团团对话机器人哄哄模拟器培训班智能客服仿ChatPDF 笔记如下:语雀知识笔记《SpringAI》

【数据结构】单链表的增删查改

本文是小编巩固自身而作,如有错误,欢迎指出! 1.链表的概念 概念:链表是⼀种物理存储结构上⾮连续、⾮顺序的存储结构,数据元素的逻辑顺序是通过链表中的 指针链接次序实现的。 和之前的顺序表不同,顺序一般…