Who‘s Harry Potter? Approximate Unlearning in LLMs

本文是LLM系列文章,针对《Who’s Harry Potter? Approximate Unlearning in LLMs》的翻译。

哈利波特是谁?LLMs中的近似遗忘

  • 摘要
  • 1 引言
  • 2 我们方法的描述
  • 3 评估方法
  • 4 结果
  • 5 结论

摘要

大型语言模型(LLM)是在大量的互联网语料库上训练的,这些语料库通常包含受版权保护的内容。这给这些模型的开发人员和用户,以及原始作者和出版商带来了法律和道德挑战。在本文中,我们提出了一种新的技术,用于从LLM中忘记训练数据的子集,而不必从头开始重新训练。
我们评估了我们在从Llama2-7b模型(Meta最近开源的生成语言模型)中忘记哈利波特书的任务上的技术。虽然该模型花费了超过184K个GPU小时进行预训练,但我们发现,在大约1个GPU小时的微调中,我们有效地消除了该模型生成或回忆哈利波特相关内容的能力,而其在常见基准测试(如Winogrande、Hellaswag、arc、boolq和piqa)上的性能几乎不受影响。据我们所知,这是第一篇在生成语言模型中提出有效的遗忘技术的论文。
我们的技术由三个主要组成部分组成:首先,我们使用一个在目标数据上进一步训练的强化模型,通过将其logits与基线模型的logits进行比较,来识别与遗忘目标最相关的token。其次,我们将目标数据中的特殊表达式替换为通用表达式,并利用模型自己的预测为每个token生成替代标签。这些标签旨在近似尚未在目标数据上训练的模型的下一个标记预测。第三,我们在这些替代标签上对模型进行微调,无论何时提示其上下文,这都会有效地从模型的内存中删除原始文本。

1 引言

2 我们方法的描述

3 评估方法

4 结果

5 结论

教授大型语言模型(LLM)以选择性遗忘,或“忘记”的雄心勃勃的努力,证明了人工智能和机器学习世界中固有的微妙复杂性。人们普遍认为这是一项艰巨的任务,任何在LLM中启用此类功能的尝试都是创新解决方案的先锋,因此,我们的概念验证可以说强调了进步。
首先,我们的研究表明,正如我们对Llama2-7b模型的实验中的积极结果所表明的那样,忘记学习虽然具有挑战性,但并不是一项不可逾越的任务。然而,这一成就必须以审慎的态度来看待。我们目前的方法——基于向模型提供的提示进行评估,并评估由此产生的完成情况——尽管在某些情况下有效,但可能对提取信息的更具对抗性的方法视而不见。可以想象,非传统或复杂的方法,如深入研究token概率分布,可能会无意中揭示模型对未学习内容的潜在熟悉程度。
深入探究我们的技术潜在的普遍性,当考虑到《哈利·波特》系列的独特属性时,会出现一个相关的观察结果。这些书充满了独特的表达方式和独特的名字——事后看来,这些特征可能助长了我们的遗忘策略。在许多LLM的训练数据中,哈利波特主题的明显存在进一步加剧了挑战。鉴于这种广泛的表现,即使是提示中的最轻微提示也可能引发一连串相关的填充,突显出模型中根深蒂固的记忆深度。
我们方法论的一个细微之处在于依赖GPT-4对哈利波特宇宙的现有知识。为了检测特定的锚定术语并设计通用的对应术语,GPT-4的专业知识被证明是有用的。这就提出了一个问题,如果没有如此丰富的先验知识,我们的技术是否能达到类似的效果。初步实验表明,在缺乏这些知识的情况下,实体提取仍然是有效的,我们推测,对特质表达的不熟悉可以通过简单的n-gram频率分析来解决,但我们为未来的工作留下了更彻底的研究。
将我们的方法扩展到其他类型的内容,特别是非小说或教科书,也带来了一系列挑战。与哈利波特的虚构世界不同,非虚构内容将不会拥有相同密度的独特术语或短语。此外,非虚构文本通常嵌入更高层次的结构,如思想、概念或文化视角。目前还不确定我们的技术能在多大程度上有效地处理和消除这些更抽象的元素。这显然需要对我们的技术进行调整。
总之,虽然我们的技术提供了一个有希望的开端,但它在各种内容类型中的适用性仍有待彻底测试。所提出的方法提供了一个基础,但还需要进一步的研究来完善和扩展LLM中更广泛的遗忘任务的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/124433.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java商城免费搭建 VR全景商城 saas商城 b2b2c商城 o2o商城 积分商城 秒杀商城 拼团商城 分销商城 短视频商城

1. 涉及平台 平台管理、商家端(PC端、手机端)、买家平台(H5/公众号、小程序、APP端(IOS/Android)、微服务平台(业务服务) 2. 核心架构 Spring Cloud、Spring Boot、Mybatis、Redis 3. 前端框架…

maven环境变量,安装源,本地仓库配置

1. maven环境变量 我这里用的是idea自带的maven 数值为: D:\software\computer_software\java\IDEAJ\IDEAJ2021.2.1\IntelliJ IDEA 2021.2.1\plugins\maven\lib\maven3\bin 2. 安装源更换为阿里云(我不知道清华源是什么网址,网上也没查到&am…

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-如何用自己数据微调ChatGLM2模型训练 目录 GPT实战系列-如何用自己数据微调ChatGLM2模型训练1、训练数据广告文案生成模型训练和测试数据组织: 2、训练脚本3、执行训练调整运行 4、问题解决问题一问题二问题三问题四 1、训练数据 广告文案生成模型 输…

vue导出功能

<a-buttontype"primary"class"search-btn"click"downLoadClick">下载导出结果</a-button> // 下载导出结果 const downLoadClick async () > {try {const response await axios({url: ${getBaseUrl()}/gpt/admin/messageExport…

分布式:一文吃透分布式事务和seata事务

目录 一、事务基础概念二、分布式事务概念什么是分布式事务分布式事务场景CAP定理CAP理论理解CAPCAP的应用 BASE定理强一致性和最终一致性BASE理论 分布式事务分类刚性事务柔性事务 三、分布式事务解决方案方案汇总XA规范方案1&#xff1a;2PC第一阶段&#xff1a;准备阶段第二…

【计算机网络】什么是HTTPS?HTTPS为什么是安全的?

【面试经典题】 前言&#xff1a; HTTP最初的设计就是用于数据的共享和传输&#xff0c;并没有考虑到数据的安全性&#xff0c;如窃听风险&#xff0c;篡改风险和冒充风险。HTTPS是在 HTTP 的基础上引入了一个加密层。HTTPS通过数据加密&#xff0c;数据完整性检验和身份认证…

【Java 进阶篇】Java登录案例详解

登录是Web应用程序中常见的功能&#xff0c;它允许用户提供凭证&#xff08;通常是用户名和密码&#xff09;以验证其身份。本文将详细介绍如何使用Java创建一个简单的登录功能&#xff0c;并解释登录的工作原理。我们将覆盖以下内容&#xff1a; 登录的基本概念创建一个简单的…

安装Jdk 报错 ,Java SE Development Kit 8 Update 202(64-bit)安装完毕之前,向导被中断

具体原因没有找到&#xff0c;估计是由于jdk 没有删干净导致的&#xff0c;我的处理方法是&#xff0c;将 Java的注册表全然后手动安装 Jdk和导入注册表&#xff08;在同事那里获取jdk文件 压缩包&#xff0c;并将 java的注册表导出&#xff0c;放在自己电脑上使用。&#xff0…

ChatGPT扩展系列之ChatExcel

文章目录 ChatGPT扩展系列之ChatExcel对某一列的文字进行处理对数据进行排序对数据进行计算微软官方又推出Excel AI插件ChatGPT扩展系列之ChatExcel 自从ChatGPT很空出世之后,很多基于ChatGPT的应用便如雨后春笋般应用而生,这些应用的底层本质就是利用了ChatGPT对自然语言的…

Linux curl命令最全详解

https://blog.csdn.net/angle_chen123/article/details/120675472

M1本地部署Stable Diffusion

下载安装 参考博客: 在Mac上部署Stable Diffusion&#xff08;超详细&#xff0c;AI 绘画入门保姆级教程&#xff09; 安装需要的依赖库 brew install cmake protobuf rust python3.10 git wget 可能中途会存在下载报错或者下载卡主的问题,需要切国内源 brew进行替换源: …

树莓派 qt 调用multimedia、multimediawidgets、serialport、Qchats

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、测试11.命令安装出现错误 二、测试21. 安装 Qt Charts&#xff1a;2. 安装 Qt Multimedia 和 Qt MultimediaWidgets&#xff1a;3. 安装 Qt SerialPort&…

C/S架构和B/S架构

1. C/S架构和B/S架构简介 C/S 架构&#xff08;Client/Server Architecture&#xff09;和 B/S 架构&#xff08;Browser/Server Architecture&#xff09;是两种不同的软件架构模式&#xff0c;它们描述了客户端和服务器之间的关系以及数据交互的方式。 C/S 架构&#xff08…

Springboot的Container Images,docker加springboot

Spring Boot应用程序可以使用Dockerfiles容器化&#xff0c;或者使用Cloud Native Buildpacks来创建优化的docker兼容的容器映像&#xff0c;您可以在任何地方运行。 1. Efficient Container Images 很容易将Spring Boot fat jar打包为docker映像。然而&#xff0c;像在docke…

VS 控制台程序出现不能引用c的问题

在visual stduio测试纯c代码时&#xff0c;出现main调用c接口时不能引用的问题&#xff1a; 错误 LNK2019 无法解析的外部符号 "void __cdecl xxx_alg_init(void)" (?xxx_alg_initYAXXZ)&#xff0c;函数 main 中引用了该符号 xxx_alg_init 原因是c程序调…

Leaky singletons的一种使用场景

Leaky singletons的一种使用场景 文章目录 Leaky singletons的一种使用场景场景问题本质如何解决Leaky singletons 场景 最近遇到了这个问题&#xff0c;正好想记录下。 比如你有一段代码&#xff0c;如下&#xff08;伪代码&#xff09;&#xff1a; static std::map<int…

python下载图片的脚本,requests模块的使用

python下载图片的脚本 import requests# 定义图片的url链接 image_url "https://example.com/image.jpg"# 发送网络请求&#xff0c;获取图片数据 response requests.get(image_url)# 检查响应状态码 if response.status_code 200:# 获取文件名file_name image_u…

【已解决】取消 el-aside 默认宽度|不再用 !important

文章目录 问题原因解决方法 问题原因 element-ui 的 el-aside 组件有 width props&#xff0c;默认为 300px 解决方法 给 el-aside 标签添加 width"" width 为空&#xff08;不正确的css样式/写法&#xff09;样式将会失效。 就可以在 style 中修改 el-aside 宽…

笔记检验(一):笔记检验概述

文章目录 一、 笔迹的概念及成分&#xff08;一&#xff09; 笔迹的概念&#xff08;二&#xff09; 笔迹的成分 二、 笔迹检验的概念、任务及作用&#xff08;一&#xff09; 笔迹检验的概念&#xff08;二&#xff09; 笔迹检验的任务&#xff08;三&#xff09; 笔记检验的作…

系统架构主题之八:非功能性需求对系统架构及设计的影响

从大的方面来讲&#xff0c;软件系统的需求分为功能性需求和非功能性需求。功能性需求一般由业务分解而来&#xff0c;是直接面向用户的需求&#xff0c;也是直接体现用户价值的需求。非功能性需求一般多是由功能性需求的内在要求衍生而来&#xff0c;其价值更多的体现在对功能…