LoRA微调-挑战(1)-数据质量

news/2026/1/23 22:09:59/文章来源:https://www.cnblogs.com/aibi1/p/19524154

目录
  • 总结
  • 明确定义 label schema(互斥 / 可多选)
  • 一、总体设计原则(先说清楚“为什么这样分”)
  • 二、Intent Schema 定义(可直接写进标注文档)
    • Intent 1:FACT_QUERY(功能性 / 数据型查询)
      • 1️⃣ Intent 定义(Definition)
      • 2️⃣ 触发条件(When to use)
      • 3️⃣ 示例(Positive Examples)
      • 4️⃣ 不触发条件(When NOT to use)
      • 5️⃣ 反例(Negative Examples)
      • 6️⃣ 技术绑定(工程约束,面试加分)
    • Intent 2:KNOWLEDGE_QUERY(知识型问答)
      • 1️⃣ Intent 定义(Definition)
      • 2️⃣ 触发条件(When to use)
      • 3️⃣ 示例(Positive Examples)
      • 4️⃣ 不触发条件(When NOT to use)
      • 5️⃣ 反例(Negative Examples)
      • 6️⃣ 技术绑定(工程约束)
  • 三、互斥 / 可多选规则(这是面试官必追问点)
    • 1️⃣ 两个 Intent 是否互斥?
      • 规则写法(直接可用)
    • 2️⃣ 复合问题如何处理?(高级)
      • 示例
  • 四、Golden Sample 示例(结合你这个场景)
  • 引入 golden samples 做一致性校验
  • 对高混淆样本做人工 review + 再标注

总结

intent 本身就高度相关,标注人员很容易混淆:

  • 每个 label 的定义、反例和冲突规则写成标注规范。
  • 同时引入一批 golden samples,作为高置信标准样本,在标注前做校准、标注中做抽检、入训前做质量 gate,用 golden accuracy 和 Kappa 系数监控一致性,避免 LoRA 学到不稳定边界。
  • 对高混淆样本做人工 review + 再标注

明确定义 label schema(互斥 / 可多选)

很好,这个例子非常工程化,而且你给出了技术实现路径(function calling / RAG),这正是面试官希望看到的。下面我按“可直接作为标注规范 + 面试可复述”的方式,完整演示如何为这 2 个 Intent 定义 清晰、可执行、可校验 的 label schema。


一、总体设计原则(先说清楚“为什么这样分”)

Intent 的定义不是语义分类本身,而是“下游技术路径选择”
即:同一句用户输入,最终是 调用系统接口,还是 检索知识并生成答案

因此:

  • FACT_QUERY → function calling → 结构化返回
  • KNOWLEDGE_QUERY → RAG → 自由文本生成

这句话在面试中说出来,会被认为是系统设计导向的 intent 设计


二、Intent Schema 定义(可直接写进标注文档)

Intent 1:FACT_QUERY(功能性 / 数据型查询)

1️⃣ Intent 定义(Definition)

用户请求确定、可验证、来自系统或数据库的事实信息
该信息需要通过 接口调用或参数化查询 获得,而非模型主观生成。


2️⃣ 触发条件(When to use)

什么触发条件?
“触发条件其实就是给标注员或者模型判定的具体规则,告诉你这条话应该归哪个 Intent。

触发条件 ≈ 业务场景特征
也就是说,它描述了用户在什么具体场景下,会产生某个 Intent 的需求。
但它比纯业务场景更可操作,因为它指明了模型或标注员可以观察到的特征(比如关键词、输出形式、信息来源),不是抽象概念。

概念 理解 举例
业务场景 用户在什么情境下提出请求 “用户想查自己订单状态”
触发条件 判定某条输入属于这个 Intent 的可观察特征 “句子里有‘状态’、‘多少’,输出是结构化数据,可直接从接口获取”

满足 至少一个

  • 查询实时 / 准实时数据
  • 查询用户或业务系统中的结构化字段
  • 明确要求「查 / 看 / 返回 / 给我具体数值」

典型动词

  • 查、看、返回、多少、有没有、状态、列表

3️⃣ 示例(Positive Examples)

“我这个订单现在是什么状态?”
“帮我查一下上个月的账单金额”
“这个账号还有多少可用额度?”
“目前库存还有吗?”

4️⃣ 不触发条件(When NOT to use)

  • 请求解释、原因、原理、使用建议
  • 无法通过单次接口返回的开放性问题

5️⃣ 反例(Negative Examples)

“为什么我的订单一直没发货?”        # 原因解释 → KNOWLEDGE_QUERY
“这个功能一般什么时候用?”            # 使用场景 → KNOWLEDGE_QUERY

6️⃣ 技术绑定(工程约束,面试加分)

下游处理方式:
- 使用 function calling
- 必须生成结构化参数
- 禁止自由发挥式生成

Intent 2:KNOWLEDGE_QUERY(知识型问答)

1️⃣ Intent 定义(Definition)

用户请求背景解释、使用说明、原理性说明或经验性知识
答案通常来自 文档、FAQ、知识库,而非业务系统接口。


2️⃣ 触发条件(When to use)

满足 至少一个

  • “是什么 / 为什么 / 怎么用 / 有什么区别”
  • 无明确结构化返回格式
  • 允许一定程度自然语言生成

典型动词

  • 是什么、为什么、怎么、区别、介绍一下、解释

3️⃣ 示例(Positive Examples)

“这个功能是做什么用的?”
“为什么会出现这个错误?”
“如何使用自动续费?”
“接口超时一般是什么原因?”

4️⃣ 不触发条件(When NOT to use)

  • 明确请求当前用户或系统状态
  • 可通过单条接口直接返回的事实

5️⃣ 反例(Negative Examples)

“我当前的套餐是什么?”       # FACT_QUERY
“这个月用了多少流量?”       # FACT_QUERY

6️⃣ 技术绑定(工程约束)

下游处理方式:
- RAG(向量检索 + 文档拼接)
- 允许解释型生成
- 输出为自然语言

三、互斥 / 可多选规则(这是面试官必追问点)

1️⃣ 两个 Intent 是否互斥?

结论:默认互斥,但允许复合输入拆解

规则写法(直接可用)

- 单轮输入中:- 若问题核心是“拿数据” → FACT_QUERY- 若核心是“要解释” → KNOWLEDGE_QUERY

2️⃣ 复合问题如何处理?(高级)

示例

“我这个订单现在什么状态?为什么这么久还没发货?”

处理方式(你这样说非常加分)

  • 主 Intent:FACT_QUERY(查状态)
  • 子 Intent:KNOWLEDGE_QUERY(解释原因)

但在 标注层

  • 当前轮只打 FACT_QUERY
  • 原因解释交给 下一轮或规则补充

👉 这体现你理解多意图 ≠ 多路径同时执行


四、Golden Sample 示例(结合你这个场景)

你可以直接给一个 golden 样本:

{"query": "帮我查一下订单12345的物流状态","intent": "FACT_QUERY","reason": "需要调用订单系统接口返回结构化字段"
}
{"query": "为什么我的订单会被取消?","intent": "KNOWLEDGE_QUERY","reason": "请求原因解释,答案来自规则或文档"
}

引入 golden samples 做一致性校验

对高混淆样本做人工 review + 再标注

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1206684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整教程:Alluxio正式登陆Oracle云市场,为AI工作负载提供TB级吞吐量与亚毫秒级延迟

完整教程:Alluxio正式登陆Oracle云市场,为AI工作负载提供TB级吞吐量与亚毫秒级延迟pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; f…

Cesium进阶教程:Shader与三维GIS可视化实战

视频合集点击查看 视频教程大纲: 1.cesium进阶教程:在cesium后处理中移植shadertoy的代码 2.cesium进阶教程:后处理绘制圆形 3.cesium进阶教程:封装自定义materialProperty 4.cesium进阶教程:自定义材质实现流动线…

Trae AI零基础编程入门:纯小白也能快速上手

视频点击这里直接观看 1、简介 新中地推出Trae AI编程系列课程,本系列课程共分为三个模块,系统讲解Trae IDE的核心功能与实战应用,手把手教你学会Trae,提升编程效率。 PS. 针对纯小白,没有任何AI编程基础的同学也能…

java研发工程师必知必会

java研发工程师必知必会java作为一种跨平台、面向对象的编程语言,广泛应用于企业级Web开发和移动应用开发。其核心特性包括可移植性(一次编写,到处运行)、安全性、分布式支持以及泛型编程能力。又因其简单易学深受…

【笔记】【底层逻辑1】

目录 精读刘润《底层逻辑 1》:看透世界运转规律,少走人生弯路 一、 是非对错的底层逻辑:三种视角,三种答案 二、 分清人性、道德和法律:别混淆三者的边界 三、 人生的三层智慧:选择、定力、博弈 第一层智慧:选择 —— 先知道 “有的选”,再敢放弃 第二层智慧:定…

静态 Top Tree

哈哈哈学会的新东西啊,暴搓312行 在此鸣谢机房大蛇QEDQEDQED&&zxkqwq进行一个讲解 前置知识 en。没有。 (可能要理解下线段树的结构,前缀和,二分) 定义 Top Tree是什么? 就是对于一个给定的树,通过comp…

【笔记】【周期】

目录 《周期》核心解读笔记 第一类:基本面周期 —— 经济、政府、企业的底层逻辑 1. 经济周期 2. 政府调节周期 3. 企业盈利周期 第二类:心理周期 —— 投资人的情绪钟摆 1. 心理钟摆 2. 风险态度周期 第三类:市场周期 —— 信贷、房地产、股市的具体玩法 1. 信贷…

typescript-类的访问权限public、private、protected

访问权限这个你可以理解为类的某个属性或者某个方法可以在哪里访问。分三种,public(默认),protected,privatepublicpublic表示在任意的地方都可以访问某个类的属性或者方法。场景:比如你叫小名,别人要叫你的时候,得知道你的名字&a…

【笔记】【逆向思维:顶级大脑的降维思考智慧】

目录 逆向思维:顶级大脑的降维思考智慧 方法一:反向目标法 —— 从 “要什么” 到 “不要什么” 方法二:因果倒置法 —— 从 “结果推原因” 到 “原因推反向结果” 方法三:换位思考法 —— 从 “我的视角” 到 “对立面视角” 误区一:为了反向而反向,忽略底层逻辑 …

工信部擘画“开源新基建”:推动工业互联网平台生态跃迁

当工业的庞大躯干寻求智能化的灵魂,一场围绕“连接”与“控制”的深层博弈正在展开。开源,这把曾经重塑了互联网世界的钥匙,如今被赋予了打开工业互联网下一道价值之门的使命。1月13日,中华人民共和国工业和信息化部(以…

ASTM D4169-23e1测试,ASTM D4169标准模拟,包装运输测试ASTM D4169试验

一、标准定义与合规性确认 ASTM D4169-23e1 是美国材料与试验协会(ASTM International)发布的《运输集装箱和系统性能测试的标准实施规程》,2023 年 12 月批准、2024 年 1 月发布,核心是通过实验室模拟物流全链路风险&#xff0c…

【课程设计/毕业设计】基于SpringBoot的医院医疗护工陪护系统的设计与实现基于springboot的护工管理便捷服务系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

中国AI模型的“双向涟漪”——从全球南方自主到美企的市场转向

美国闭源AI模型长期以“技术垄断地缘绑定”主导全球市场,中国开源人工智能模型则以“自主可控、成本友好、适配本地”为核心优势,逐步渗透全球南方国家、发达国家企业及硅谷核心圈,推动全球AI技术选择格局发生深刻变革。据彭博社、英国《金融…

SRM+AI智能寻源:10分钟搞定供应商寻源!

对于采购人员而言,寻源是采购非常重要,但同时也非常耗费精力的环节。传统模式下,为找到合适的供应商,采购人员可能需要:通过搜索引擎大量检索、搜集各类供应商信息,筛选符合要求的供应商。逐一在征信平台上…

Java计算机毕设之基于Springboot的医疗护理管理服务系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

强烈安利8个AI论文网站,本科生搞定毕业论文不求人!

强烈安利8个AI论文网站,本科生搞定毕业论文不求人! 论文写作不再难,AI 工具助你轻松应对 对于很多本科生来说,毕业论文是一项既重要又棘手的任务。从选题到撰写,再到修改和降重,每一步都充满了挑战。而如今…

firebird 数据库 C# 开发报错

1、找不到dllUnable to load DLL fbembed or one of its dependencies: 找不到指定的模块。 (0x8007007E) 2、磁盘结构错误发现式12 不支持13的错误 firebird下载的exe选择3的版本。不要选5的版本。 3、占用,多个程…

企业邮箱收费吗?解析主流品牌的三种收费模式

在企业数字化转型的进程中,专业的企业邮箱已成为标配工具。许多初创团队和企业在初次接触时,常会疑惑:“企业邮箱收费吗?” 答案是肯定的。与个人免费邮箱不同,专业的企业邮箱服务通常需要付费,以获得专属域…

PCB行业MES厂商TOP3推荐:主流厂商对比与务实建议

在智能制造深入推进的背景下,MES系统已成为PCB企业提升效率、保障质量、满足客户追溯要求的关键基础设施。然而,PCB制造具有工序繁多(20道)、产品高度非标(HDI/FPC/厚铜板等)、质量敏感度高、交付节奏快等特…

PCB板上你是普通油墨,我是低损耗油墨,能一样吗?

一博高速先生成员--黄刚 文章一开始就先给各位选择困难症的粉丝们出一道题,如果今天让你们来设计下面的这组25G光口信号的布线,你会选择走内层还是表层呢? 其实高速先生相信在座的各位PCB工程师更愿意选择走表层,原因就是过孔如果…