大模型-Bert+PET实战

PET(Pattern-Exploiting Training)

背景:预训练语言模型(比如BERT)知识全面,但是没有针对下游任务做针对训练,所以效果一般,所以需要根据任务做微调。

核心思想:根据先验知识人工定义模版,将目标分类任务转换为与MLM一致的完形填空,然后再去微调MLM任务参数。

项目介绍:一般情况,我们可以直接用bert模型对评论进行分类,这种效果一般,尤其是比较少小众的场景。但如果用少量带标签的评论样本对Bert模型进行Tuning,那模型效果就会大幅提升

AutoTokenizer
from transformers import AutoModelForMaskedLM, AutoTokenizer
#使用bert-base-chinese模型
tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-chinese")
my_text = '有时候我常常在想,人活着的意义究竟是什么' #19个字+1个标点符号
sb = tokenizer(text=my_text,truncation=True,max_length=15,padding='max_length')#得到sb:
{'input_ids': [101, 3300, 3198, 952, 2769, 2382, 2382, 1762, 2682, 8024, 782, 3833, 4708, 4638, 102], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}tokenizer.decode(sb['input_ids'])#解码'[CLS] 有 时 候 我 常 常 在 想 , 人 活 着 的 [SEP]'
  • bert的tokenizer是字符级别的编码,而不是词,标点符号也会编码。
  • 截断15,这15个已经包含了[CLS]和[SEP]。
  • Bert是一种MLM(Masked Language Modeling)模型。
  • tokenizer在使用训练结构后,也需要保存。(可能训练的过程它会自动新增token?)
ClassEvaluator(验证模型效果)
    def __init__(self):self.goldens = []self.predictions = []
  • 在计算验证集指标时,只需要记录两个list,一个是模型预测的标签,另一个是真实的标签,例如self.goldens=["体育","财经"]。
  • 模型评估:训练集有几十条,测试集有几百条。

  • 每10步打印一次loss,每20步用验证集评估一下效果,当f1得分上涨就保存模型。

  • 模型评估:要看不同类别的指标表现效果。{'衣服': {'precision': 0.55, 'recall': 0.97, 'f1': 0.7}, '酒店': {'precision': 1.0, 'recall': 0.86, 'f1': 0.93}}

  • 全局指标-accuracy准确率:

模型预测:

  • verbalizer:有两列第一列主标签(业务需要的分类) 第二列子标签(模型输出分类),模型输出不同分类可能映射到同一个主标签。
  • 先把要待分类的数据(评论)放到prompt中,然后用tokenizer编码放入模型,然后将预测得到的logit转换成ids,然后convert_ids_to_tokens转成子类别名称,然后再查询verbalizer,得到主标签。

ClassEvaluator

持续更新中。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/871654.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【问题解决】Could not find a package configuration file provided by “autoware_msgs“

问题描述 通过catkin_make命令编译时,产生问题如下: Base path: /home/defu/PncProject/frenet_planner_ws Source space: /home/defu/PncProject/frenet_planner_ws/src Build space: /home/defu/PncProject/frenet_planner_ws/build Devel space: /…

银河麒麟高级服务器操作系统 V10 SP3 2403

系统简介 银河麒麟高级服务器操作系统V10是一款为企业级关键业务设计的新一代自主服务器操作系统,它满足虚拟化、云计算、大数据等时代需求,具备高可靠性、安全性、性能和扩展性。该系统基于CMMI5级标准开发,支持多种国产处理器平台&#xf…

PTA 7-15 希尔排序

本题目要求读入N个整数,采用希尔排序法进行排序,采用增量序列{5,3,1},输出完成增量5和增量3后的5子排序和3子排序结果。 输入格式: 输入不超过100的正整数N和N个整数(空格分隔)。 输出格式: …

UDP网络通信(发送端+接收端)实例 —— Python

简介 在网络通信编程中,用的最多的就是UDP和TCP通信了,原理这里就不分析了,网上介绍也很多,这里简单列举一下各自的优缺点和使用场景 通信方式优点缺点适用场景UDP及时性好,快速视网络情况,存在丢包 与嵌入…

重学PyTorch,粗略笔记(一)

很久之前学PyTorch记的笔记,顺手整理一下 安装 Start Locally | PyTorch pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118tensors张量 标量是零维张量,向量是一维张量,矩阵是二维张量&am…

【密码学】分组密码的设计原则

分组密码设计的目标是在密钥控制下,从一个巨大的置换集合中高效地选取一个置换,用于加密给定的明文块。 一、混淆原则 混淆原则是密码学中一个至关重要的概念,由克劳德香农提出。混淆原则就是将密文、明文、密钥三者之间的统计关系和代数关系…

后端实现图片上传本地,可采用url查看图片

前言 本文将实现在数据库中存储图片url,url可以在浏览器中访问查看。 整体思路为: 上传图片到本地指定地址为图片分配url保存至数据库根据分配url,进行物理地址映射到本地指定地址 具体实现 controller层: 上传图片到本地指定…

【JavaEE】网络编程——TCP

🤡🤡🤡个人主页🤡🤡🤡 🤡🤡🤡JavaEE专栏🤡🤡🤡 文章目录 前言1.网络编程套接字1.1流式套接字(TCP)1.1.1特点1.1.2编码1.1.2.1ServerSo…

玩转springboot之xxxRunner接口使用

Runner使用 如果需要在SpringApplication启动后执行一些逻辑,可以使用ApplicationRunner或CommandLineRunner接口,这两个接口都是只有一个run方法 public interface ApplicationRunner {void run(ApplicationArguments args) throws Exception;}public…

华为USG6000V防火墙v1

目录 一、实验拓扑图 二、要求 三、IP地址规划 四、实验配置 1🤣防火墙FW1web服务配置 2.网络配置 要求1:DMZ区内的服务器,办公区仅能在办公时间内(9:00-18:00)可以访问,生产区的设备全天可以访问 要求2:生产区不…

电影《头脑特工队2》观后感

上周看了电影《头脑特工队2》,整体是非常不错的,一个大脑中,想象的世界。 (1)人格-多元政体理论 记得前几年是看过《头脑特工队1》的,当时电影是非常出名的,当时有很多研究理论,都…

memcached 介绍与详解和关键代码

Memcached是一种分布式内存对象缓存系统,用于缓存数据库查询结果、API调用结果或任意计算结果。它的设计初衷是为了减轻数据库负载,提高应用程序性能。下面是对Memcached的介绍和详解,以及关键代码示例。 功能介绍: 以键值对形式…

【练习】分治--归并排序

🎥 个人主页:Dikz12🔥个人专栏:算法(Java)📕格言:吾愚多不敏,而愿加学欢迎大家👍点赞✍评论⭐收藏 目录 归并排序 代码实现 交易逆序对的总数 题目描述 ​编辑 题解 代码实…

JAVA从入门到精通之入门初阶(二)

1. 自动类型转换 自动类型转换:类型范围小的变量可以赋值给类型范围大的变量 byte->int public class java_7_10 {public static void main(String[] args) {//自动类型转换//类型范围小的变量可以赋值给类型范围大的变量 byte->intbyte a 12;int b a;//自动…

9个最适合使用的Java分析器

Java分析器工具可以明显的提高问题定位、分析、处理的效率,下面会给大家简单的介绍几款日常工作过程中使用到的Java分析器。 0.什么是 Java 分析器? Java 分析器是一种用于测量和检查 Java 应用程序性能的工具。它收集程序执行数据,包括每个…

C语言 ——— 输入两个正整数,求出最小公倍数

目录 何为最小公倍数 题目要求 代码实现 方法一:暴力求解法(不推荐) 方法二:递乘试摸法(推荐) 何为最小公倍数 最小公倍数是指两个或者多个正整数(除了0以外)的最小的公共倍数…

代码随想录算法训练营第38天

LeetCode 322. 零钱兑换 链接 class Solution { public:int coinChange(vector<int>& coins, int amount) {if(amount 0) {return 0;}vector<int> dp(amount 1, 0);for(auto i : coins) {if(i < amount) {dp[i] 1;}}for(int i 0; i < coins.size()…

在 Android 中定义和使用自定义属性

1. 定义自定义属性 首先&#xff0c;我们需要在 res/values/attrs.xml 文件中定义自定义属性。这些属性可以是颜色、尺寸、字符串等。 创建或打开 res/values/attrs.xml 文件&#xff0c;并添加以下内容&#xff1a; <?xml version"1.0" encoding"utf-8&…

【LeetCode】205. 同构字符串

认真地分类讨论&#xff0c;评判复杂度&#xff0c;再决定是否要写代码执行。整套流程干净利落&#xff0c;不存在主观臆想&#xff0c;也不会有对事实结果计算的巨大偏差。 1. 题目 2. 分析 这里提供一版可以解题的思路。 定义两个词典&#xff0c;这两个词典分别记录s字符串…

DHC2-2多时段电子式时间继电器 带底座 约瑟JOSEF

DHC2多时段电子式时间继电器 DHC2-H多时段电子式时间继电器 DHC2-1多时段电子式时间继电器 DHC2-2多时段电子式时间继电器 DHC2-3多时段电子式时间继电器 一、特点 超小型面板尺寸DIN 36X36mm(DHC1)、DIN 48X48m(DHC2) 有延时吸合、延时释放、等周期循环三种规格 可替代…