大模型开发学习笔记

文章目录

  • 大模型基础
    • 大模型的使用
    • 大模型训练的阶段
    • 大模型的特点及分类
    • 大模型的工作流程
      • 分词化(tokenization)与词表映射
    • 大模型的应用
  • 进阶
    • agent的组成和概念
    • planning规划
      • 子任务分解
      • ReAct框架
    • memory记忆
    • Tools工具\工具集的使用
    • langchain
      • 认知框架
        • ReAct框架
        • plan-and-Execute计划与执行
        • self-ask(自问自答)
        • thinking and self-refection思考并自我反思
      • ReAct框架实例
      • 通过llamindex实现ReAct RAG Agent
      • agent数字人项目实战
    • 提示词\提示词工程
      • prompt提示词是什么?
      • prompt结构

大模型基础

foundational Models,基础模型或称基座模型,即大模型

大模型的使用

prompt engineering(提示词工程)

大模型训练的阶段

  1. 预训练
  2. SFT(监督微调)
  3. RLHF(基于人类反馈的强化学习)

大模型的特点及分类

  • 适应性灵活性强

  • 广泛数据集的预训练

  • 计算资源需求大

  • 参数规模大

  • 大语言模型

  • 多模态模型(计算机视觉\语音)

大模型的工作流程

分词化(tokenization)与词表映射

  • 词粒度,适用英文
  • 字符粒度,中文分词
  • 子词粒度,将单词分解为更小的单位
  • 每一个token通过预先设置好的词表,映射为一个tokenid,这是token的身份证

大模型的应用

理解人类或自己本身,就能很好的学会大模型应用及开发

进阶

agent的组成和概念

在这里插入图片描述
memory + tools + Planning + Action <-----agent

agent的决策流程
在这里插入图片描述

planning规划

子任务分解

思维链(chain of thoughs,CoT)
思维树(Tree of thoughs,ToT),使用深度优先或广度优先搜索
在这里插入图片描述

ReAct框架

搜索高端手机,最好用的手机
组合推理和行动.首先通过推理确定搜索"苹果手机",并从外部环境中观察结果.随着推理的深入,识别出需要搜索…几轮交互后,得出标准答案

memory记忆

智能体中的记忆机制

  • 形成记忆,大模型训练参数得到的记忆
  • 短期记忆,当前任务的暂存记忆
  • 长期记忆,长期保留的信息,通常用向量数据库来存储和检索

Tools工具\工具集的使用

使用工具突破大模型本身的限制

langchain

agent只是实现智能体的框架,真正的大脑还是LLM

认知框架

ReAct框架

在这里插入图片描述

plan-and-Execute计划与执行

在这里插入图片描述

self-ask(自问自答)

在这里插入图片描述

thinking and self-refection思考并自我反思

在这里插入图片描述

ReAct框架实例

我的理解是langchain已经在这些认知框架中把提示词封装好了,不用我们去手写了

通过llamindex实现ReAct RAG Agent

agent数字人项目实战

技术栈:agent + RAG + webRPC + docker
一些技术是要收费的

提示词\提示词工程

以上我的理解是对的,不同适用场景的AI工具,就是将提示词工程提前封装了,不用再让用户\使用者麻烦地定义\构建提示词

  1. 精确性
  2. 灵活性多样性
  3. 风格

prompt提示词是什么?

适用大模型时,向其输入的指令
prompt构建的原则?

  • 清晰明确,提供充足的上下文
  • 使用标点符号更清晰
  • 用样例数据指引模型输出
  • 分步骤引导
  • 一般用json格式,效果最好

prompt结构

  1. context上下文(上下文),角色\任务\知识
  2. instruction命令,步骤\思维链\示例
  3. input data输入数据,句子\文章\问题
  4. output indicator,输出格式
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/903859.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

4.27-5.4学习周报

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 摘要Abstract一、方法介绍2.Rainbow Memory(RM)2.1多样性感知内存更新2.2通过数据增强增强样本多样性(DA) 二、使用步骤1.实验概况2.RM核心代码 总结 摘要 本博客概…

AI Rack架构高速互连的挑战:损耗设计与信号完整性的设计框架

在AI驱动的时代&#xff0c;系统设计已经从单一PCB的视角&#xff0c;逐步转向以整个rack为单位来考量。 对于信号完整性而言&#xff0c;焦点以不再局限于单一PCB上的损耗&#xff0c;而是扩展到芯片与芯片之间的端到端互连损耗&#xff08;end-to-end interconnect loss&…

杭电oj(1180、1181)题解

目录 1180 题目 思路 问题概述 代码思路分析 1. 数据结构与全局变量 2. BFS 函数 bfs 3. 主函数 main 总结 代码 1181 题目 思路 1. 全局变量的定义 2. 深度优先搜索函数 dfs 3. 主函数 main 总结 代码 1180 题目 思路 注&#xff1a;当走的方向和楼梯方向一…

软件测试概念

这里写目录标题 需求开发模型软件生命周期瀑布模型螺旋模型增量模型、迭代模型敏捷模型Scrum 测试模型V模型W模型&#xff08;双V模型&#xff09; 需求 用户需求&#xff1a;没有经过合理的评估&#xff0c;通常就是一句话 软件需求&#xff1a;是开发人员和测试人员执行工作…

数字基带信号和频带信号的区别解析

数字基带信号和数字频带信号是通信系统中两种不同的信号形式&#xff0c;它们的核心区别在于是否经过调制以及适用的传输场景。以下是两者的主要区别和分析&#xff1a; 1. 定义与核心区别 数字基带信号&#xff08;Digital Baseband Signal&#xff09; 未经调制的原始数字信号…

Linux52 运行百度网盘 解决故障无法访问repo nosandbox 未解决:疑似libstdc++版本低导致无法运行baidu网盘

昨日参考 哦 我是root Cannot find a valid baseurl for repo: centos-sclo-rh/x86_64 没了 计划去手动下一个 还是不行 放弃 猜测是 centos7 过期了 一些依赖组件也没地方下载了 通过阿里云镜像站下载 之前安装的好像不是这个版本 还是计划用yum去下载依赖&#xff0c;先处…

2000-2022年上市公司数字经济专利申请数据

2000-2022年上市公司数字经济专利申请数据 1、时间&#xff1a;2000-2022年 2、来源&#xff1a;国家知识产权局 3、指标&#xff1a;年份、股票代码、股票简称、行业名称、行业代码、省份、城市、区县、行政区划代码、城市代码、区县代码、首次上市年份、上市状态、数字经济…

机器学习之五:基于解释的学习

正如人们有各种各样的学习方法一样&#xff0c;机器学习也有多种学习方法。若按学习时所用的方法进行分类&#xff0c;则机器学习可分为机械式学习、指导式学习、示例学习、类比学习、解释学习等。这是温斯顿在1977年提出的一种分类方法。 有关机器学习的基本概念&#xff0c;…

Chromium 134 编译指南 - Android 篇:安装构建依赖项(七)

1. 引言 欢迎来到《Chromium 134 编译指南》系列的第七篇文章&#xff01;在前面的章节中&#xff0c;我们已经成功获取了Chromium源代码&#xff0c;并将其配置为支持Android平台。这些步骤为我们的编译之旅奠定了坚实的基础&#xff0c;但在开始实际编译之前&#xff0c;我们…

java 进阶 1.0

静态方法 static 就是能直接用&#xff0c;不用再new一个对象了 一般java中Math等静态类就是可以直接使用其方法 main函数里面不能包含太多的逻辑性语句&#xff0c;全部写成模块 写好程序之后如何测试呢&#xff1f; 使用junit&#xff0c;不能在main函数里测试 测试本身就…

中小企业MES系统详细设计

版本&#xff1a;V1.1 日期&#xff1a;2025年5月2日 一、设备协议兼容性设计 1.1 设备接入框架 #mermaid-svg-PkwqEMRIIlIBPP58 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-PkwqEMRIIlIBPP58 .error-icon{fill…

Spring Security会话管理

用户认证通过后&#xff0c;为了避免用户的每次操作都进行认证&#xff0c;可以将用户的信息保存在会话中。会话就是系统为了保持当前用户的登录状态所提供的机制&#xff0c;常见的有基于Session方式、基于Token方式等。Spring Security提供会话管理功能&#xff0c;只需要配置…

PostgreSQL数据库操作基本命令

常用操作sql &#x1f510; 用户管理 -- 创建用户 CREATE USER username WITH PASSWORD password;-- 修改用户密码 ALTER USER username WITH PASSWORD newpassword;-- 删除用户 DROP USER username;&#x1f4e6; 数据库操作 -- 创建数据库 CREATE DATABASE dbname;-- 删除…

[吾爱出品] 网文提取精灵_4.0

网文提取精灵 链接&#xff1a;https://pan.xunlei.com/s/VOPDvKljcT3EWLjpt5LeDZvfA1?pwdw8kq# 易语言写的&#xff0c;介意的不要下载 相对网文提取工具_2.10.02版&#xff0c;因为是重写界面&#xff0c;目前版本限制最高5线程&#xff0c;暂时不支持批处理。 虽然不支…

每日算法-250502

每日算法 - 2025.05.02 记录一下今天刷的几道 LeetCode 算法题。 3191. 使二进制数组全部等于 1 的最少操作次数 I 题目 思路 贪心 解题过程 遍历数组 nums。当我们遇到 nums[i] 时&#xff1a; 如果 nums[i] 是 1&#xff0c;我们不需要进行操作&#xff0c;因为目标是全 …

移动端开发中设备、分辨率、浏览器兼容性问题

以下是针对移动端开发中设备、分辨率、浏览器兼容性问题的 系统化解决方案&#xff0c;按开发流程和技术维度拆解&#xff0c;形成可落地的执行步骤&#xff1a; 一、基础环境适配&#xff1a;从「起点」杜绝兼容性隐患 1. Viewport 元标签标准化 <meta name"viewpor…

2025最新AI绘画系统源码 - 画图大模型/GPT-4全支持/AI换脸/自定义智能体

在AI绘画技术日新月异的2025年&#xff0c;比象AI绘画系统源码以其突破性的技术创新重新定义了数字艺术创作的边界。作为第四代AI绘画引擎&#xff0c;我们不仅集成了最先进的GPT-4o多模态画图模型&#xff0c;实现了从基础文生图到专业级艺术创作的全面进化。本系统源码经过多…

构造函数详解

构造函数的作用 构造函数的主要任务是初始化对象&#xff0c;而不是创建对象&#xff08;对象的内存空间在构造函数被调用前已经分配好&#xff09;。 构造函数特性 命名规则&#xff1a;函数名必须与类名完全相同。 返回值&#xff1a;构造函数没有返回值类型&#xff08;连…

jaffree 封装ffmpeg 转换视频格式,获取大小,时间,封面

下载 参考网址 【收藏级教程】FFmpeg音视频处理宝典&#xff1a;从入门到精通的50个实用技巧_ffmpeg教程-CSDN博客 配置环境变量 验证 重启idea开发工具 springboot maven集成 <dependency><groupId>com.github.kokorin.jaffree</groupId><artifactId&…

2505C++,wmi客户端示例

原文 #define _WIN32_DCOM #include <iostream> using namespace std; #include <comdef.h> #include <Wbemidl.h> #pragma comment(lib, "wbemuuid.lib") int main(int argc, char **argv) {HRESULT hres;//初化COM.hres CoInitializeEx(0, CO…