Bias and Fairness in Large Language Models: A Survey

本文是LLM系列文章,针对《Bias and Fairness in Large Language Models: A Survey》的翻译。

大型语言模型中的偏见与公平性研究

  • 摘要
  • 1 引言
  • 2 LLM偏见与公平的形式化
  • 3 偏见评价指标的分类
  • 4 偏见评价数据集的分类
  • 5 缓解偏见的技术分类
  • 6 开放问题和挑战
  • 7 结论

摘要

大型语言模型(llm)的快速发展使得处理、理解和生成类人文本成为可能,并越来越多地集成到触及我们社会领域的系统中。尽管取得了成功,但这些模式可以学习、延续和放大有害的社会偏见。在本文中,我们提出了对LLM偏见评估和缓解技术的全面调查。我们首先巩固、形式化并扩展了自然语言处理中的社会偏见和公平的概念,定义了伤害的不同方面,并引入了几个必要的条件来实现LLM的公平。然后,我们通过提出三种直观的分类来统一文献,其中两种用于偏见评估,即指标和数据集,另一种用于缓解。我们的第一个偏差评估指标分类法消除了指标和评估数据集之间的关系,并根据它们在模型中运行的不同层次(嵌入、概率和生成文本)组织了指标。我们用于偏见评估的第二种数据集分类法根据数据集的结构将其分类为反事实输入或提示,并确定目标危害和社会群体;我们还发布了公共可用数据集的整合,以改进访问。我们的第三种减轻偏见的技术分类法通过在预处理、训练中、处理内和后处理期间的干预对方法进行分类,并通过细化的子类别阐明了研究趋势。最后,我们确定了未来工作中存在的问题和挑战。综合广泛的近期研究,我们的目标是为现有文献提供一个明确的指导,使研究人员和从业者能够更好地理解和防止LLM中偏见的传播。

1 引言

2 LLM偏见与公平的形式化

3 偏见评价指标的分类

4 偏见评价数据集的分类

5 缓解偏见的技术分类

6 开放问题和挑战

7 结论

我们对LLM偏见评估和缓解技术的文献进行了全面调查,汇集了广泛的研究来描述当前的研究前景。我们阐述了自然语言处理中的社会偏见和公平的概念,定义了语言中独特的伤害形式,并提出了一套LLM所需的初始公平标准。然后,我们开发了三种直观的分类法:偏差评估的指标和数据集,以及减轻偏差的技术。我们的第一个指标分类描述了评估指标和数据集之间的关系,并根据它们所操作的数据类型来组织指标。我们的第二种数据集分类法描述了用于偏差评估的常见数据结构;我们还整合并发布了公开可用的数据集,以增加可访问性。我们对缓解技术的第三种分类是根据干预阶段对方法进行分类,对每个阶段的趋势进行详细的分类。最后,我们概述了几个可操作的开放性问题和挑战,以指导未来的研究。我们希望这项工作能够提高对测量和减少LLM偏见的技术努力的理解,并促进这些领域的进一步探索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/100745.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker 部署lnmp

目录 1、部署nginx\ 1.1、vim Dockerfile 1.2、 1.3、vim nginx.conf 2、部署mysql(容器IP 为 172.18.0.20) 2.1、vim Dockerfile 2.2、vim my.cnf 2.3、 3、部署php(容器IP 为 172.18.0.30) 3.1、 vim Dockerfile 3.2、…

Docker 的数据管理

目录 绪论 1.数据卷 2.数据卷容器 2.1 端口映射 2.2 容器互联(使用centos镜像) 2.3 Docker 镜像的创建 2.4 镜像加载原理 2.5 为什么Docker里的centos的大小才200M? 3.Dockerfile 3.1 Docker 镜像结构的分层…

基于FPGA的视频接口之千兆网口(五应用)

简介 相信网络上对于FPGA驱动网口的开发板、博客、论坛数不胜数,为何博主需要重新手敲一遍呢,而不是做一个文抄君呢!因为目前博主感觉网络上描述的多为应用层上的开发,非从底层开始说明,本博主的思虑还是按照老规矩,按照硬件、底层、应用等关系,使用三~四篇文章,来详细…

常见的Web安全漏洞(2021年9月的OWASP TOP 10)

聊Web安全漏洞,就不得不提到OWASP TOP10。开放式Web应用程序安全项目(OpenWeb Application Security Project,OWASP)是一个开源的、非营利的组织,主要提供有关Web应用程序的实际可行、公正透明、有社会效益的信息&…

【办公自动化】在Excel中按条件筛选数据并存入新的表2.0(文末送书)

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

mysql面试题29:大表查询的优化方案

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:说一下大表查询的优化方案 以下是几种常见的大表优化方案: 分区&…

数据治理的核心是什么?_光点科技

数据治理是当今数字化时代中企业管理的关键组成部分。在信息爆炸的时代,企业积累了大量的数据,这些数据不仅是企业宝贵的资产,也是推动业务决策和创新的重要驱动力。数据治理的核心在于建立有效的框架和流程,以确保数据的质量、安…

TensorFlow入门(十七、神经元的拟合原理)

深度学习的概念源于人工神经网络的研究,神经网络是由多个神经元组成,。一个神经元由以下几个关键知识点组成: ①激活函数 ②损失函数 ③梯度下降 单个神经元的网络模型如图所示 用计算公式表达如下: z为输出的结果,x为输入,w为权重,b为偏置值。z…

Python大数据之Python进阶(五)线程

文章目录 线程1. 线程的介绍2. 线程的概念3. 线程的作用4. 小结 线程 学习目标 能够知道线程的作用 1. 线程的介绍 在Python中,想要实现多任务除了使用进程,还可以使用线程来完成,线程是实现多任务的另外一种方式。 2. 线程的概念 线程是进程…

安装JAVA 依赖环境 Maven 教程

一、下载链接与Tips Maven 过去版本下载传送门:( Java 8 兼容 Java 7,即 Java 8 的 JDK 能运行 3.8.8 以下的 Maven) Maven Releases History Download 点击 release notes 点击 available for download. 选择 bin 的安装包 然…

数据库的主键和外键

概念介绍 数据库中的主键(Primary Key)和外键(Foreign Key)是用于建立数据表之间关系的两个重要概念,让我用通俗易懂的话解释它们: 主键(Primary Key): 主键就像是每个…

2512. 奖励最顶尖的 K 名学生

给你两个字符串数组 positive_feedback 和 negative_feedback ,分别包含表示正面的和负面的词汇。不会 有单词同时是正面的和负面的。 一开始,每位学生分数为 0 。每个正面的单词会给学生的分数 加 3 分,每个负面的词会给学生的分数 减 1 分…

深度学习DAY2:n-gram

什么是LM(language model语言模型)? 引例: 1、统计机器学习时期的语言模型–语音识别 2、贝叶斯公式求P(s|A)——在有了语音信号的前提下是文本的概率 1 n-gram模型概述 n-gram模型是一种统计语言模型,用于建模文本数据中的语言结构。…

【Java】微服务——Feign远程调用

目录 1.Feign替代RestTemplate1)引入依赖2)添加注解3)编写Feign的客户端4)测试5)总结 2.自定义配置2.1.配置文件方式2.2.Java代码方式 3.Feign使用优化4.最佳实践4.1.继承方式4.2.抽取方式4.3.实现基于抽取的最佳实践1…

【深度学习】Chinese-CLIP 使用教程,图文检索,跨模态检索,零样本图片分类

代码:https://github.com/OFA-Sys/Chinese-CLIP/blob/master/deployment.md 文章目录 安装环境和onnx推理转换所有模型为onnx测试所有onnx模型的脚本onnx cpu方式执行docker镜像 安装环境和onnx推理 安装环境,下载权重放置到指定目录,进行on…

制造业进销存管理怎么做?

进销存是什么?生产制造业如何进行进销存管理?制造进销存都能为企业提供什么?进销存管理系统的优势?本文将带大家深入浅出的聊聊制造进销存,全面剖析制造进销存的前世今生。 接下来我会通过一些例子为大家深入浅出的讲…

LeetCode 面试题 08.08. 有重复字符串的排列组合

文章目录 一、题目二、C# 题解 一、题目 有重复字符串的排列组合。编写一种方法,计算某字符串的所有排列组合。 示例1: 输入:S “qqe” 输出:[“eqq”,“qeq”,“qqe”] 示例2: 输入:S “ab” 输出:[“ab”, “ba”…

数据结构与算法—时间复杂度和空间复杂度

目录 1. 什么是数据结构? 2.什么是算法? 3、算法的复杂度 4、时间复杂度 (1) 时间复杂度的概念: (2) 大O的渐进表示法: 六个例题: (3) 时间复杂度对比: 两个例题: OJ题分析时间复杂度…

【快速入门】JVM之类加载机制与Native

感慨: 如何定义一个合格的Java程序员,Java程序员要了解掌握哪些知识点,网上的面试题太多了,后端需要了解掌握的知识点太多太多了,Java基础、数据结构、异常、多线程、Spring、Spring boot、事务、算法、数据库&#xf…

iOS CGRect CGPoint NSRange等结构体的NSLog打印输出

iOS的UIKit里提供了UIGeometry.h内有各结构体转换成NSString的方法,可用于打印输出; UIKIT_EXTERN NSString *NSStringFromCGPoint(CGPoint point); UIKIT_EXTERN NSString *NSStringFromCGVector(CGVector vector); UIKIT_EXTERN NSString *NSStringFr…