【Token系列】14|Prompt不是文本,是token结构工程

文章目录

  • 14|Prompt不是文本,是token结构工程
    • 一、很多人写的是“自然语言”,模型读的是“token序列”
    • 二、Prompt写法会直接影响token结构密度
    • 三、token分布影响Attention矩阵的聚焦方式
    • 四、token数 ≠ 有效信息量
    • 五、Prompt结构设计建议(以token为单位思考)
    • 六、实战小结:如何检查Prompt是否结构良好?
    • 七、结语

14|Prompt不是文本,是token结构工程

副标题:理解Prompt写法,先理解它如何被切分成token和影响Attention结构


一、很多人写的是“自然语言”,模型读的是“token序列”

语言模型不会“按人类的语义”理解Prompt,而是按其被切分成的token结构来处理。

例子:

Prompt A: 请你给我写一个优美的诗句。
Prompt B: 帮我写诗。

你觉得A更有礼貌,但模型可能:

  • 更关注“写”和“诗”这些关键词;
  • “请你”、“优美”可能被切成多个token,被稀释掉;
  • 如果Prompt太长,有效信息被Attention平均掉,影响理解。

二、Prompt写法会直接影响token结构密度

token结构密度 = 在有限token中,信息是否集中、分布是否便于模型识别

例子:

① “你能否帮我生成一个关于春天的句子?”  
② “生成:春天 句子”
  • ① token数量多,但语义分散,可能有20个token,模型注意力稀释;
  • ② 精准关键词更少token,密度高,注意力集中,更易触发相关生成。

三、token分布影响Attention矩阵的聚焦方式

Transformer中的Self-Attention结构如下:

attention(Q, K, V) = softmax(QK^T / √d) * V
  • Q来自当前token;
  • K来自所有token。

如果Prompt写法导致:

  • 无效token太多 → Q对无关K打分;
  • 关键词不突出 → 无法获得高attention值;
  • token靠前还容易被截断;

→ 这些都直接干扰模型的注意焦点。


四、token数 ≠ 有效信息量

你输入了100个token,不代表信息量高。例子:

A: “请问你能否为我推荐一些在春天适合阅读的书籍?”
B: “推荐:春天 读书”→ 模型看到的有效token:
- A中“你能否”“适合”拆成多个token,句式冗余;
- B中核心token“推荐”“春天”“读书”高密度排列 → 更有效;

五、Prompt结构设计建议(以token为单位思考)

场景优化策略
复杂指令拆分为结构清晰的token块,如“目标:”“范围:”
信息稀释删除客套与冗语,如“你能不能帮我…”,“请问…”
多轮对话用标记提示结构变化,如“历史对话:”“当前任务:”
控制生成结果使用明确指令token,如“格式为:”“使用markdown”

六、实战小结:如何检查Prompt是否结构良好?

  1. 用tokenizer工具查看token化结果

    示例:
    输入:“你能不能帮我推荐一本书”
    → token列表:[“你”, “能”, “不”, “能”, “帮”, “我”, “推”, “荐”, “一”, “本”, “书”]
    → 说明部分词被拆分,结构松散,可优化为:“推荐一本书”

  2. 检查高信息词是否被切断

    示例:
    “Transformer模型如何工作” → 若“Transformer”被拆成多token,建议拼写统一(如用“transformer”英文)

  3. 检查是否用过多低信息词填充Prompt空间

    示例:
    “请问你可不可以帮我完成一项简单的小小的工作?”
    → 可压缩为:“完成一项任务”

  4. 控制总token数,让高密度token尽可能靠后

    示例:
    将“以下是背景信息…”提前,将任务问题压到Prompt结尾,以避免截断影响回答质量。

  5. 优化关键词顺序,让Q能高效与K建立attention连接

    示例:
    不推荐:“你在上文中说过……” → 模型找不到“上文”;
    推荐:“请解释以下内容:‘你上次提到的观点是……’” → 提示结构更稳定,关键词更集中。


七、结语

Prompt不是“你说了什么”,而是“你输入了哪些token”:

语言模型不理解礼貌,它只理解结构密度。

理解Prompt的token结构,是LLM时代写作与指令工程的第一课


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/79071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

研发效率破局之道阅读总结(4)个人效率

研发效率破局之道阅读总结(4)个人效率 Author: Once Day Date: 2025年4月30日 一位热衷于Linux学习和开发的菜鸟,试图谱写一场冒险之旅,也许终点只是一场白日梦… 漫漫长路,有人对你微笑过嘛… 全系列文章可参考专栏: 程序的艺术_Once-Day…

CNN代码详细注释

import torch from torch import nn#定义张量x,它的尺寸是5x1x28x28 #表示了5个单通道28x28大小的数据 xtorch.zeros([5,1,28,28])#定义一个输入通道是1,输出通道是6,卷积核大小是5x5的卷积层 convnn.Conv2d(in_channels1,out_channels6,ker…

机器指标监控技术方案

文章目录 机器指标监控技术方案架构图组件简介Prometheus 简介核心特性适用场景 Grafana 简介核心特性适用场景 Alertmanager 简介核心特性适用场景 数据采集机器Node ExporterMySQL ExporterRedis ExporterES ExporterRocketMQ ExporterSpringcloud ExporterNacos 数据存储短期…

【Office-Excel】单元格输入数据后自动填充单位

1.自定义设置单元格格式 例如我想输入数字10,回车确认后自动显示10kg。 右击单元格或者快捷键(Ctrl1),选择设置单元格格式,自定义格式输入: 0"kg"格式仍是数字,但是显示是10kg&…

JavaScript的3D库有哪些?

JavaScript的3D库有哪些? 在3D开发领域,JavaScript提供了多种库和框架,使开发者能够在浏览器中创建丰富的3D体验。以下是一些流行的3D方面的JavaScript库: Three.js:这是最著名的用于创建3D图形的JavaScript库之一。它…

中央网信办部署开展“清朗·整治AI技术滥用”专项行动

为规范AI服务和应用,促进行业健康有序发展,保障公民合法权益,近日,中央网信办印发通知,在全国范围内部署开展为期3个月的“清朗整治AI技术滥用”专项行动。 中央网信办有关负责人表示,本次专项行动分两个阶…

论文阅读:2024 arxiv Jailbreaking Black Box Large Language Models in Twenty Queries

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Jailbreaking Black Box Large Language Models in Twenty Queries https://www.doubao.com/chat/4008882391220226 https://arxiv.org/pdf/2310.08419 速览 这篇论文是来…

零基础学指针2

零基础学指针---大端和小端 零基础学指针---什么是指针 零基础学指针---取值运算符*和地址运算符& 零基础学指针---结构体大小 零基础学指针5---数据类型转换 零基础学指针6---指针数组和数组指针 零基础学指针7---指针函数和函数指针 零基础学指针8---函数指针数组…

《Python实战进阶》 No46:CPython的GIL与多线程优化

Python实战进阶 No46:CPython的GIL与多线程优化 摘要 全局解释器锁(GIL)是CPython的核心机制,它保证了线程安全却限制了多核性能。本节通过concurrent.futures、C扩展优化和多进程架构,实战演示如何突破GIL限制&#…

Golang实现函数默认参数

golang原生不支持默认参数 在日常开发中,我们有时候需要使用默认设置,但有时候需要提供自定义设置 结构体/类,在Java我们可以使用无参、有参构造函数来实现,在PHP中我们也可以实现(如 public function xxx($isCName false, $sec…

Chrome 136 H265 WebRTC 支持 正式版本已包含

时间过的真快,去年8月份写过一篇文章介绍如何加参数方式启动Chrome H265 硬件解码器, 现在的136版本已经包含在内,至此WebRTC已经完整包含了H264和H265解码器,这个事情应该从2015年开始,Google强推VP9 AV1&#xff0c…

12.SpringDoc OpenAPI 功能介绍(用于生成API接口文档)

12.SpringDoc OpenAPI 功能介绍(用于生成API接口文档) SpringDoc OpenAPI 是一个基于 OpenAPI 3.0/3.1 规范的工具,用于为 Spring Boot 应用生成 API 文档。它是 springfox(Swagger 2.x)的现代替代方案,完全支持 Spring Boot 3.x…

CentOS Linux 环境二进制方式安装 MySQL 5.7.32

文章目录 安装依赖包新建用户解压初始化配置文件启动服务登录MySQL修改密码停止数据库 安装依赖包 yum -y install libaio perl perl-devel libncurses* autoconf numactl新建用户 useradd mysql解压 tar xf mysql-5.7.32-linux-glibc2.12-x86_64.tar.gz mv mysql-5.7.32-l…

Webug4.0通关笔记06- 第8关CSV注入

目录 CSV注入漏洞 1.CSV漏洞简介 2.漏洞原理 (1)公式执行 (2)DDE机制 (3)OS命令执行 3.漏洞防御 第08关 CSV注入 1.打开靶场 2.修改源码 3.注入命令 4.导出excel表 5.打开excel表 CSV注入漏洞…

Windows和 macOS 上安装 `nvm` 和 Node.js 16.16.0 的详细教程。

Windows和 macOS 上安装 nvm 和 Node.js 16.16.0 的详细教程。 --- ### 1. 安装 nvm(Node Version Manager) nvm 是一个 Node.js 版本管理工具,可以轻松安装和切换不同版本的 Node.js。 #### Windows 安装 nvm 1. **下载 nvm 安装包**&#x…

[特殊字符] 蓝桥杯省赛全解析:含金量、获奖难度、参赛意义与发展价值全面剖析

蓝桥杯省赛刚刚落幕,不论你是刚参加完比赛的同学,还是还在观望是否值得投入时间去准备蓝桥杯的学生,相信你都关心: 蓝桥杯到底值不值得参加? 获奖难不难?含金量如何? 和其它算法竞赛相比有什么…

ASP.NET MVC后端控制器用模型 接收前端ajax数据为空

1、前端js代码 如下: const formData {DeptName: D001,Phone: 12345678900 };$.ajax({url: "/Phone/SavePhone1",type: "POST",contentType: "application/json",data: JSON.stringify(formData), //必须要JSON.stringifysuccess:…

拥抱 Kotlin Flow

1. 引言 Kotlin Flow 是 Kotlin 协程生态中处理异步数据流的核心工具,它提供了一种声明式、轻量级且与协程深度集成的响应式编程模型。与传统的 RxJava 相比,Flow 更简洁、更易于维护,尤其在 Android 开发中已成为主流选择。本文将从基础概念…

精益数据分析(34/126):深挖电商运营关键要点与指标

精益数据分析(34/126):深挖电商运营关键要点与指标 在创业和数据分析的学习之旅中,我们都在不断探寻如何让业务更上一层楼。今天,我依旧带着和大家共同进步的想法,深入解读《精益数据分析》中电商运营的关…

Learning vtkjs之ImageCropFilter

过滤器 图片数据体积裁剪 介绍 vtkImageCropFilter可以裁剪vtkImageData。这只适用于IJK对齐的平面。 请注意,由于CPU限制的裁剪,这在大型数据集上会很慢。 效果 核心代码 需要实现这个代码主要逻辑 1、设定的crop的包围盒 其实主要是IMax IMin JM…