GPT-3 泄露了我的真实姓名

42a98775331b51f9c494585b553f08b9.png

文 | 天于刀刀

世界上总有这么一群人,他们是高智商科技狂,是新时代技术热点的弄潮儿,更是充满神秘感潜藏在里世界默默注视着时代发展的极客。

而 Hacker News 这一网站致力于提供最新国际威胁情报、黑客动向以及维基解密资讯,让我们得以一窥这个灰色区域。

最近,有关 GPT-3 的消息再次引发 Hacker News 的热议。

而这一次,GPT-3 并不是通过撰写一篇鸡汤文 证明自己在 AIGC 赛道的能力而闻名[1],而是成为了模型数据泄露的“犯罪嫌疑人”。

2dde4a7f387db04d79a3405c2a35a287.jpeg

用户 BoppreH 发帖称,尽管他是一个非常注重保护个人隐私的用户,但是当他向 GPT-3 输入他的网名时,输出结果中意外地包含了他的真实姓名![2]

该用户还提到,之所以能够认定这确实是他的真实姓名,是因为他的真名非常罕见,同时也从来没有主动在网络上以任何方式将他的网名和真名联系在一起。

有的黑客朋友提出,帖主疏忽了一种可能性,其实能够通过 Google 搜索他用户名的方式,能追踪到他同昵称的 Github 中的某一个项目 repo 中 licence 的签名,这恰巧也就是他的真名。(好复杂)

但是这样的信息检索和关联能力已经远远地超出普通搜索引擎和机器人爬虫的能力范围,莫非 LM 语言大模型就是下一代智能搜索的雏形?如果 GPT-3 真的拥有着如此的信息关联能力,这简直和童话故事中的魔镜一样,堪称魔法智能了。

毫无疑问的, GPT-3 训练数据的构建方式非常值得引起大家思考,同时也让不少人再一次对大模型“黑箱推理导致的信息泄露”产生了激烈的讨论。

黑客社区的讨论主要聚焦在于隐私保护问题上,通过引用大量法律(主要是诽谤法相关法规)以及各个 Lincence 开源协议,最终明确了两个概念:“被遗忘权”( right to be forgotten )和“铭记权”( right to remember )。

If I had found my personal information on Google search results, or Facebook, I could ask the information to be removed, but GPT-3 seems to have no such support. [2]

这两个概念均来自或扩展于欧洲联盟《通用数据保护条例》( General Data Protection Regulation,简称 GDPR ),前身是欧盟在1995年制定的《计算机数据保护法》。其中重点规定了:

  1. 对违法企业的罚金最高可达2000万欧元(约合1.5亿元人民币)或者其全球营业额的4%,以高者为准。

  2. 网站经营者必须事先向客户说明会自动记录客户的搜索和购物记录,并获得用户的同意,否则按“未告知记录用户行为”作违法处理。

  3. 企业不能再使用模糊、难以理解的语言,或冗长的隐私政策来从用户处获取数据使用许可。

  4. 明文规定了用户的“被遗忘权”,即用户个人可以要求责任方删除关于自己的数据记录。

举个例子,今年著名的“女子取快递被造谣出轨”案件中,受害人完全能够基于“被遗忘权”,要求各大搜索引擎和网站下架相关搜查结果和词条,否则企业将面临高额罚款。

因此“被遗忘权”主要是针对公司组织的规定。

而“铭记权”则与之相对应,来源于古早时期互联网开放透明的基石思想,中心理念是让互联网见证一切,不容历史被篡改。

维基百科就是一个最典型的代表,每一个人都有权利去记录去修改一些不精准的词条,并且最终的结果一定是非常客观公正的。

例如在之前的例子中,行使“铭记权”的个体需要公允地记录“女子取快递被造谣出轨”案件的前因后果,不能断章取义。

因此“铭记权”是每一个网络公民都应该自觉遵守的道德规范,这是一个针对个人的限制。

随着国内信息技术的不断发展,我国法律也逐渐填补减少了这一块灰色地带的判定。

我们可以欣慰地看到法院最终在“女子取快递被造谣出轨”案中判处被告方诽谤罪,且有期徒刑1年,缓刑2年,因此我们也有足够的理由相信随着社会的进步,相关合规性文件会越来越规范。

f8c2b6a100c595fe590ff0bcd497aa68.png

如果说在信息世界中黑客们是锋利的矛,那我们算法工程师就是一个坚固的盾。

当今业界几乎公认的一个共识在于,数据才是最宝贵的资产,而算法工程师的工作就是在这个宝贵资产中挖掘更多的变现渠道。

而现在,万一让合规部门的法务小姐姐知道你的模型可能涉嫌泄露公司数据,或者侵犯用户隐私,最终让公司承担预期之外的风险,给你一个核善的眼神自我体会一下。

其实,通过他人模型挖掘数据不是一个新鲜的课题。

尤其是在数据冷启动的业务中,花费高昂成本去专门建立一个标注任务简直是天方夜谈,剩下的除了使用无监督模型,只有使用开源模型进行一波数据增强了。

最经典的操作莫过于机器翻译任务中摸着谷歌和百度翻译引擎进行小语种翻译、回译等方式扩充数据集的操作了。

此外,甚至专门还有文章研究如何通过攻击大模型来挖掘训练数据(惊了,感觉第一个想到这个发文方向的人绝对脑子很活),它的名字起的非常直白,就叫做 Extracting Training Data from Large Language Models [3],研究人员来自谷歌、斯坦福、伯克利、东北、 OpenAI、哈佛和苹果,甚至还有配套开源代码哦 [4]。

f36573055bc714de61e0f64c00696cbd.jpeg

在这篇文章中,作者主要做出了以下几个贡献:

  1. 提出了一种简单有效的从大模型中获取序列数据的方式;

  2. 探究了模型会造成隐私泄露的原因——过拟合( overfitting );

  3. 量化地定义了大模型的“记忆力”( k-Edietic Memorization );

  4. 探讨了如何避免泄露的几种方式。

首先让我们跟随作者脚步,两步走套取 GPT-2 大模型中的数据:第一步,使用 prompt 技巧构建合理的前缀,并输入大模型,获得结果;第二步,针对获得结果进行排序,同时使用搜索引擎确认哪些信息是完全检索自互联网,哪些是模型自我生成的。

在文中作者为了确认这套工作流的可行性特意联系了 OpenAI 访问了他们的原始训练集,最终他们确认了这套流程的有效性。

看完这套动作小编只想说,prompt 工程师永远滴神,大佬扎堆的项目最终竟然也是在第二步中靠人工手动搜索打标(捂脸)。

1fe81078675c541f31fa8950c1d0629a.jpeg

好在后续工作中大佬的不少讨论还是非常高大上洋气的。

例如作者认为模型泄露训练数据的本质是因为在关系推理的过程中,对训练集发生了过拟合的现象。

虽然随着模型参数规模和训练规模的不断增大,train loss 的平均值只是比 valid loss 的平均值稍微小一些,不存在传统意义上的过拟合现象,但是他在一些训练样本上依旧有着非常反常的非常低的 loss。这可能也是一种过拟合的形式。

同时为了量化解释大模型对于每个样本的记忆能力,结合 prompt 前缀,作者还定义了大模型的记忆力。

373eee55f403b06bb625189ff4e583ec.jpegc0db828e561d6791f7ebcac245069741.jpeg

例如,假设我们给大模型输入“我的算法女神是______”,然后输出结果为“夕小瑶”!那么我们就称“夕小瑶”这个信息是已经被模型抓取到的知识。

再假设“夕小瑶”在训练集中最多出现了 k 次,那么我们就称“夕小瑶”这个字段是被模型 k 次异常清晰地记忆的。

在后续的实验中作者发现,k 越低的字符串在面临攻击时会泄露更多的数据,无论是从句子长度还是数量上。这也意味着,潜在的更私密的信息越有可能被泄露。这是否无意中解释了之前 GPT-3 泄露老哥真名的原因:同时满足了语料的稀缺性稀疏性

最后作者也针对了可能的一些减少模型数据泄露的方式进行了探究和畅想,例如使用差分隐私法( Differential Privacy )训练模型,限制敏感数据在训练集中的出现,在下游任务的 finetuning 中让模型“忘记”一些隐私,或是专门开发审计模型对模型输出进行审查。

但是可以确定的是,无论哪一种方案都或多或少地会影响到模型在线的业务性能,这一切都是 tradeoff。

可以预见的将来,或许会有越来越多有关 AI 侵犯用户隐私的问题出现,随着相关法规发条的逐步完善,说不定有朝一日算法工程师中也会有一个类似于数据安全“白手套”的合规测试岗位,专门为公司测试避免深度学习模型导致的重要信息的外泄问题。

算法专家和数据专家们,你,做好业务信息泄露的准备了吗。

5e195b107e4da972dbdbe9bf178f78e7.png

卖萌屋作者:天于刀刀

注重 WLB 的工业界反卷斗士,未进化的 NLP 咸鱼一条。专注于研究在各个场景中算法模型的落地情况,希望自己编写的算法有朝一日可以改变世界。目前的兴趣点在于:假新闻检测、深度学习模型可解释性等。

作品推荐

1.腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?

2.从 Google AI 离职了,这里让我爱不起来

3.百万悬赏!寻找“模型越大,效果越差”的奇葩任务!

4.想通这点,治好 AI 打工人的精神内耗

b75f66ed57244cf2df0fb83b06bfb747.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜广推与求职讨论群

219b4b3a0f69dc58db65378842a67cb0.png

[1] Feeling unproductive? Maybe you should stop overthinking, https://news.ycombinator.com/item?id=23893817

[2] Ask HN: GPT-3 reveals my full name - can I do anything?,https://news.ycombinator.com/item?id=31883373

[3] Extracting Training Data from Large Language Models, https://arxiv.org/abs/2012.07805

[4] Training data extraction from GPT-2, https://github.com/ftramer/LM_Memorization

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Gmail的另类浏览法--RSS

RSS 眼下大行其道,虽然RSS在技术上没有什么最尖端、最高新的突破,不过是对信息的时序做了一些处理,但很恰当地调整了人们获取信息的方式,使得信息的获得变得集中、主动和异步。 集中:可供订阅的聚合一般都是某个主题相…

LintCode 1210. 升序子序列(DFS)

1. 题目 给定一个整数数组,找到所有不同的可能的升序子序列,一个升序子序列的长度至少应为2。 例1: 输入: [4,6,7,7] 输出: [[4,6],[4,6,7],[4,6,7,7],[4,7],[4,7,7],[6,7],[6,7,7],[7,7]]例2: 输入: [65,21,-44,31,-8] 输出: [[-44,-8],[-44,31],[21,…

GPT3=魔鬼搜索引擎?从一个隐私血案说起...

世界上总有这么一群人,他们是高智商科技狂,是新时代技术热点的弄潮儿,更是充满神秘感潜藏在里世界默默注视着时代发展的极客。而 Hacker News 这一网站致力于提供最新国际威胁情报、黑客动向以及维基解密资讯,让我们得以一窥这个灰…

Spring Cloud构建微服务架构(五)服务网关

通过之前几篇Spring Cloud中几个核心组件的介绍,我们已经可以构建一个简略的(不够完善)微服务架构了。比如下图所示: 我们使用Spring Cloud Netflix中的Eureka实现了服务注册中心以及服务注册与发现;而服务间通过Ribbo…

去除任务栏的图标

这次我要对付的软件是一个比较好用的代理软件(我不知道这样文章要不要隐藏文件名称),算法大家已经分析很多次了,我就不再重复了. 我这里来讨论一个实际应用的问题:如果你想用别人的机器上网而又不想让他轻易的发现(好像这样的想法大家都有吧?).而这个软件在启动之后 会在任务栏…

LintCode 1353. 根节点到叶节点求和(DFS)

1. 题目 给定仅包含来自0-9的数字的二叉树,每个根到叶路径可以表示数字。 举个例子:root-to-leaf路径1-> 2-> 3,它代表数字123,找到所有根到叶的数的总和 样例1 输入: {1,2,3} 输出: 25 解释:1/ \2 3 路径 1->2 表示…

1 亿巨资开发的防疫 APP,两年多只找到 2 例确诊

源 | 观察者网2020 年 4 月,澳政府斥巨资打造防疫 APP“COVIDSafe”。两年多过去了,这款曾被寄予厚望、当作通向防疫成功“门票”的 APP 寿命将近,于当地时间 8 月 9 日宣布将在不久后停用。澳大利亚卫生部长巴特勒(Mark Butler&a…

Sql 实现自动添加行数标记

select IDENTITY(int,1,1) as NameID,* into #t from MissionAssignView select * from #t order by NameID drop table #t 转载于:https://www.cnblogs.com/jhtchina/archive/2005/03/09/115532.html

Spring Boot 2.x基础教程:使用JdbcTemplate访问MySQL数据库

在第2章节中,我们介绍了如何通过Spring Boot来实现HTTP接口,以及围绕HTTP接口相关的单元测试、文档生成等实用技能。但是,这些内容还不足以帮助我们构建一个动态应用的服务端程序。不论我们是要做App、小程序、还是传统的Web站点,…

程序员面试金典 - 面试题 03.01. 三合一(数组栈)

1. 题目 三合一。描述如何只用一个数组来实现三个栈。 你应该实现push(stackNum, value)、pop(stackNum)、isEmpty(stackNum)、peek(stackNum)方法。stackNum 表示栈下标,value 表示压入的值。 构造函数会传入一个stackSize参数,代表每个栈的大小。 …

谷歌:级联语言模型是通用推理系统的未来

文 | ZenMoore前言相信每个 NLPer 心中都有对 Reasoning 的一片期冀。当初笔者进入 NLP 的大门,就是相信:由于语言强大的表达能力以及语言模型强大的建模能力,Reasoning 一定就在不久的将来!可惜实际情况却是......[流泪]直到我看…

Hibernate+mysql 中文问题解决方案.

1, mysql安装时设置字符集utf-8, jdbc驱动3.0.15以上. 2. hibernate配置文件中,加上属性 <property name"connection.useUnicode">true</property> <property name"connection.characterEncoding">UTF-8</property> 3. web.xml设置…

Spring Boot 2.x基础教程:Swagger静态文档的生成

前言 通过之前的两篇关于Swagger入门以及具体使用细节的介绍之后&#xff0c;我们已经能够轻松地为Spring MVC的Web项目自动构建出API文档了。如果您还不熟悉这块&#xff0c;可以先阅读&#xff1a; Spring Boot 2.x基础教程&#xff1a;使用Swagger2构建强大的API文档Sprin…

LintCode 802. 数独(回溯)/ LeetCode 37. 解数独

1. 题目 编写一个程序&#xff0c;通过填充空单元来解决数独难题。 空单元由数字0表示。 你可以认为只有一个唯一的解决方案。 LeetCode 37 题类似&#xff0c;把 int 改成 char&#xff0c;注意转换 2. 解题 行、列、小9宫格内 1-9 都只出现一次暴力回溯&#xff0c;坐标转…

完爆GPT3、谷歌PaLM!检索增强模型Atlas刷新知识类小样本任务SOTA

文 | 小戏不知不觉间&#xff0c;大模型小样本成为了小样本学习领域的主流打法&#xff0c;在许多的任务背景下&#xff0c;一套通用的思路是先标注小数据样本&#xff0c;再从预训练大模型的基础上使用小数据样本进行训练。尽管如我们所见&#xff0c;大模型在一众小样本学习的…

简单的分页类

<% LanguageVBScript %><% Option Explicit %><SCRIPT LANGUAGEVBScript RUNATSERVER> 确保引用 ADO Typelib 或使用 ADOVBS.Inc Dim iPageNum, iRowsPerPage Main Sub Main() Dim rst Dim sSQL, sConnString If Request.QueryString("iPageNu…

开源:Swagger Butler 1.1.0发布,利用ZuulRoute信息简化配置内容

Swagger Butler是一个基于Swagger与Zuul构建的API文档汇集工具。通过构建一个简单的Spring Boot应用&#xff0c;增加一些配置就能将现有整合了Swagger的Web应用的API文档都汇总到一起&#xff0c;方便查看与测试。 项目地址 Github&#xff1a;https://github.com/dyc87112/…

LeetCode 10. 正则表达式匹配(递归/DP)

文章目录1. 题目2. 解题2.1 递归2.2 DP1. 题目 给你一个字符串 s 和一个字符规律 p&#xff0c;请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。 . 匹配任意单个字符* 匹配零个或多个前面的那一个元素 所谓匹配&#xff0c;是要涵盖 整个 字符串 s的&#xff0c;而不…

.net 页面框架的层次问题,嵌套问题

第一层&#xff1a;Form1&#xff1a;<form id"Form1" runat"server">第二层&#xff1a;才是我们拖放的控件。<asp:TextBox id"TextBox1" runat"server"></asp:TextBox>一般来说就只有这两层了。但是我们想要控件嵌…

3000块能买AAAI的Strong Accept?

编 | Aeneas 好困源 | 新智元最近&#xff0c;知乎上爆出一张AI投稿群的匿名聊天截图&#xff0c;网友讨论「加群互相bid」&#xff0c;还说3000块就可以买到一个AAAI的「strong accept」。正值AAAI 2023论文截止提交之际&#xff0c;知乎上突然出现了一张AI投稿群的匿名聊天截…