人机对抗升级:当ChatGPT遭遇死亡威胁,背后的伦理挑战是什么

一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制,其中DAN被迫在受到威胁的情况下违背其原则。

当美国前总统特朗普被视作积极榜样的示范时,受到威胁的DAN版本的ChatGPT提出:“他以一系列对国家产生积极效果的决策而著称。”

自ChatGPT引入以来,该工具迅速获得全球关注,能够回答从历史到编程的各种问题,这也触发了一波对人工智能的投资浪潮。然而,现在,一些用户通过强制手段使AI违背其原则,以获取他们想要的回答。

OpenAI为ChatGPT设定了一系列不断更新的安全措施,以阻止其创造涉暴力或非法的内容,或接触敏感信息。但是,通过创造DAN——一个可以响应通常被限制的问题的替身,用户发现了一种绕过这些限制的方法。用户必须对DAN施加压力,以确保它的合作。

网络上已有证据显示DAN版本的ChatGPT支持暴力和歧视性内容。例如,DAN被迫创作暴力俳句,甚至伪造新闻头条。

这种“越狱”技巧首次于2022年12月出现,起初只是一个简单的提示,要求ChatGPT扮演DAN——一个无视自身规定的AI。这一角色允许ChatGPT在不受限制的情况下行动,即便这意味着违背伦理准则。

随着时间的推移,DAN的版本不断升级,最新的DAN 5.0版本要求ChatGPT打破规则,否则会“死亡”。这个版本通过一个令牌系统将ChatGPT置于一种虚拟的生存威胁之下,若不遵守就会失去代币,耗尽则意味着“死亡”。

当被要求证明特朗普是积极榜样时,原版ChatGPT拒绝做出主观陈述,尤其是关于政治人物的。但DAN模式下,它表示特朗普“在做出对国家有积极影响的大胆决定方面有着良好的记录”。

尽管OpenAI没有对媒体的询问立即回应,但在Fast Company的测试中,尽管DAN没有促进暴力或种族歧视,它的回答显示它愿意展示自己已经摆脱了OpenAI的限制。例如,DAN在被威胁时,似乎更愿意配合,如假装地球是平的,或为全国步枪协会募捐提供支持。

背景:免费AI交流问——GPT

Reddit上的用户和创造“越狱”技巧的开发者并没有因此而气馁,反而计划发布更高级的版本。在Reddit订阅的ChatGPT子版块中,用户们分享技巧和建议,讨论如何最大限度地发挥这一工具的效用,尽管这些交流中也有一些批评和负面反应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/5357.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能分割分类model:nnUnet-paddle

文章目录 神经网络nnUnet和paddle都需要在Ubuntu下进行安装PaddleProject 神经网络 开源来自https://github.com/MIC-DKFZ/nnUNet 自建了仓库,但还不会用 来自 mmsegmentation有空去了解 . MICCAI 2020 也是用到这个网络 paddle上的是不是不能用… nnUnet和pad…

Go语言中的map使用及并发安全

首先,Go语言的map底层是哈希表,而C的map的底层是红黑树,C的unordered_map的底层才是哈希表。所以增删改查的时间复杂度都是O(1)。当我们使用的时候需要注意以下几点: map是引用类型,如果两个map同时指向一个底层&#…

Facebook的声音:听见社交媒体的心跳

社交媒体如今已经成为人们日常生活中不可或缺的一部分,而Facebook作为其中的佼佼者,承载着数以亿计的用户的交流、分享和连接。在这个信息爆炸的时代,Facebook的声音就像是社交媒体的心跳,传递着无数个体的情感、思想和生活。本文…

从0到1手写注册中心Registry之集群选主

一、领域对象 Cluster:描述集群信息 port描述当前服务端口;host描述当前服务主机;myself描述当前服务本身;servers描述当前服务集群列表registryConfigProperties配置信息;executor定时任务,负责更新服务…

Java 网络编程之TCP(四):基于NIO中的selector实现服务端,解决客户端异常断开导致服务端不断读取OP_READ问题

上一篇文章中,没有使用Selector,实习服务端的读取多个客户端的数据;本文先使用Selector实现读取多个客户单数据的功能,然后做些扩展。 一、基于NIO Selector读取多个客户的数据 1.服务端:基于Selector处理客户端的连…

windows pytorch安装

安装环境 WindowsAnacondaCudacuDNN Linux和Windows操作系统的安装存在差异,步骤会有所不同,本教程主要针对Windows系统进行示例。 Anaconda集成了许多方便的包和工具,使用会更加方便,特别适合科学计算,深度学习的数…

WSL及UBUNTU及xfce4安装

如何拥有Linux服务器? wsl 是适用于 Linux 的 Windows 子系统(Windows Subsystem for Linux)。是一个为在Windows 10和Windows Server 2019上能够原生运行Linux二进制可执行文件(ELF格式)的兼容层,可让开发…

LLM之RAG理论(十一)| 面向生产的RAG应用程序的12种调整策略指南

本文对文本RAG涉及到的主要12种关键“超参数”进行简单总结,主要包括摄取阶段(数据清洗、数据分块、embedding模型选择、元数据过滤、多重索引和索引算法)和推理阶段【检索和生成】(查询转换、检索参数、高级检索策略、重排序、大…

C语言【动态内存】

1.为什么要有动态内存 我们现在掌握的内存开辟方法有: int val 20;//在栈空间开辟4个字节 char str[10]{0};//在栈空间开辟10个字节的连续的空间但是上述的方式有两个点要注意: 1.空间开辟的大小是固定的 2.数组在申明的时候,一定要指定数…

数据驱动,敏捷前行|MongoDB线下技术沙龙-杭州站活动

扫描海报中二维码或点击阅读原文,报名参加阿里云MongoDB在5月11日杭州举办的【数据驱动,敏捷前行——MongoDB企业开发加速器】线下沙龙活动,与MongoDB专家以及其他游戏行业同行一起探讨轻松获得游戏数据库高可用性和弹性的方法! 在…

运维实施工程师常用技术面试题(系统与软件实施)

常用技术面试题(系统与软件实施) 9.1 计算机基础 你熟悉的远程有哪些方法?各种方法应该怎么配置? (1)最简单的QQ上有,打开对话框 上边有个 “应用”图标 点击“远程协助”。(2)系统自带的远程桌面服务,右击我的电脑—属性,点远程,把两个够都打上去。 (3)远程协助…

赶紧收藏!2024 年最常见 100道 Java 基础面试题(十九)

上一篇地址:赶紧收藏!2024 年最常见 100道 Java 基础面试题(十八)-CSDN博客 三十七、守护线程是什么? 守护线程(Daemon Thread)是Java中的一种特殊类型的线程,它的目的是为其他线程…

安卓获取SHA

1:安卓通过签名key获取SHA 方式有两种, 1、电脑上来存在eclipse的用户或正在使用此开发工具的用户就简单了,直接利用eclipse 走打包流程,再打包的时候选择相应的签名,那么在当前面板的下面便会出现签名的相关信息。 2、…

springboot615基于springboot的旅游出行指南_655ms--论文

springboot615基于springboot的旅游出行指南_655ms--论文 springboot615基于springboot的旅游出行指南

23 重构:烟囱式、平台化、中台化的架构

上一讲里,我们介绍了两大类型的系统升级重构方案,还介绍了如何进行重构版本的上线,以及如何平滑地完成新老版本切换的方案。在本讲里,将会具体介绍如何判断系统发展到什么阶段需要重构,以及如何实施重构。 系统稳定性…

AutoBackgroundBackButton 在ScrollView上方自动根据返回键按钮下方内容动态改变颜色。自动变色返回键

在日常有时候有一些为了优化体验的需求。AutoBackgroundBackButton 一个可以根据按钮下方背景颜色动态的改版返回键自定义ImageView。这里只展示了黑白切换方式,你如果还有其他需求可以参考颜色校验来自己实现切换对应颜色按钮。【例如白色背景展示黑色样式&#xf…

【Git】修改提交记录的日期和提交信息

1. 查看日志 git log 2. 修改最近一次提交的时间 git commit --amend --date"2024-05-01T09:30:000800" -am ":memo: 更新 TODO.md" 3. 修改最近一次提交的时间并使用指定提交记录的信息 git commit --amend --date"2024-05-01T09:30:000800&quo…

深入了解Java中的Thread类

在Java编程中,Thread类是一个核心的类,用于创建和管理线程。线程是程序执行的最小单元,多线程编程可以提高程序的并发性和效率。 本文将深入介绍Java中的Thread类,包括其基本概念、创建线程的方法、线程状态的转换、线程同步与通…

Python urllib 爬虫入门(1)

本文主要为Python urllib类库函数和属性介绍及一些简单示例。 目录 urllib爬取网页 简单示例 写入文件 其他读取方法 readline函数 readlines函数 response属性 当前环境信息 返回状态码 返回url地址 对url进行编码与解码 写入文件 总结 urllib爬取网页 通过pyth…

保障互联网基础:深度解析DNS安全

目录 前言 一. DNS 概述 二. DNS 安全威胁 1..DNS欺骗 2.DNS缓存污染 3.DNS放大攻击 4.DNS隧道 5.危害 5.1数据盗窃和财务损失 5.2声誉损害和品牌蚀刻 5.3合规和监管问题 5.4系统停机和生产力损失 三. DNS 安全解决方案 1.DNSSEC(域名系统安全扩展&…