SIGIR会议聚焦包容性AI与多语言技术

news/2025/11/26 20:10:34/文章来源:https://www.cnblogs.com/codeshare1135/p/19274503

某机构在SIGIR:迈向更包容的AI

SIGIR 2021会议即将召开,某机构访问学者、智利大学计算机科学副教授Barbara Poblete担任博士联盟和多样性、公平与包容委员会联合主席。

Poblete自2019年该委员会成立以来一直担任成员。"对SIGIR会议和整个SIGIR社区来说,尽可能保持包容性至关重要,"她说。"每个人都应该感到受欢迎,并受到尊重和尊严。我们为SIGIR会议制定了一套指南,与组织者共享。这个我们称之为'包容性清单'的工具,有助于使这些会议更具包容性。"

仇恨言论检测

Poblete的研究重点是将机器学习的好处扩展到新社区,并让在线社区成员感到更安全和更受欢迎。

"我从事仇恨言论检测工作,并一直专注于多语言方面,因为我们发现先前的工作主要集中在英语上,"她说。"这为南美和其他英语不是主要语言的国家造成了差距。"

Poblete解释说,主要技术挑战是利用英语资源为训练数据相对较少的非英语语言社区构建模型。

"例如,仇恨言论检测问题因国家而异。即使在智利和阿根廷之间,仇恨言论词汇也不同。这不仅仅是语言适应,还有文化适应。"

Poblete表示,他们采用数据集丰富化方法:"例如,我有西班牙语数据集,会添加标记的英语数据,看看是否可以通过添加多语言数据来改进分类器。或者我们尝试为特定领域创建特定嵌入,如仇恨言论。"

灾害检测

Poblete的研究小组开始将社交媒体分析技术应用于危机信息学领域的问题。

"我们使用社交媒体数据来改进灾害检测和信息收集工具,"Poblete解释说。"智利经常发生地震和洪水,所以对此很感兴趣。这是一个类似的问题:如何将其他语言的资源用于我们的语言?如何创建任何人都可以使用的通用工具,而不需要大量资源?"

该小组开发了一个名为twicalli.cl的网站,使用机器学习模型自动处理推文,以评估感知到的地震强度。

"智利国家地震中心使用这个系统,"Poblete说。"我们也用于海军,许多紧急办公室都依赖这个系统。智利有很多地震仪,但我们无法真正告诉人们感受到的地震情况。这是重要信息,因为不同地方可能发生相同震级的地震,但根据地震深度或地形类型,感受会不同。"

"对于人口密集且有人发推文的地区,我们可以在30分钟内估算出来。而这过去有时需要数天,需要专家到地震发生的地方。在危机管理中,最初几分钟非常重要。在这些最初几分钟收集的信息将改变应对紧急情况的方式和援助到达的速度。"

当前研究重点

"我们现在正在研究的问题是检测与危机相关的消息与噪音消息,"Poblete说。"您希望将来自事件发生地的消息与只是提及这些内容的其他人的消息分开。当您有一个流行的标签时,会收到许多与之无关的消息。为了区分这两者,我们为该问题训练特定于灾害的词嵌入。我们正在测试是否可以通过来自其他国家的地震数据来增强我们在西班牙语中关于智利地震的信息。不仅是跨语言学习,还有跨领域学习。我能否从地震中学习来检测飓风或洪水,或以前从未发生过的新事物?因为这也是应急准备的一部分。"
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/977603.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NeurlPS 2024! 扩散模型用于世界建模:视觉细节在Atari环境中至关重要| 计算机视觉 | 强化学习2

01 论文概述 论文名称:Diffusion for World Modeling: Visual Details Matter in Atari ——扩散模型用于世界建模:视觉细节在 Atari 环境中至关重要 👉一键直达论文 👉Lab4AI大模型实验室论文🌟 简介 在基于模…

48(11.28)

上了网课形势政策

Unclutter 黑五 Mac App 大包测评

今年 Unclutter 还是准时推出了 BLACK FRIDAY MAC APPS COLLECTION,这也是每年黑五 MacOS 软件最值得的大包之一。考虑到今年 BundleHunt 还表现得较为拉跨的情况下,这个大包的性价比就显得更高了。直接拿下整个大包…

详细介绍:VS Code 新旧版本 Remote-SSH 内网离线连接服务器方法(版本 ≤ 1.78.x 及 ≥ 1.79.0)

详细介绍:VS Code 新旧版本 Remote-SSH 内网离线连接服务器方法(版本 ≤ 1.78.x 及 ≥ 1.79.0)2025-11-26 20:01 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !i…

44(11.24)

上了统一建模语言,上了数据结构,上了Java课

47(11.27)

上了数据结构,上了排球课

46(11.26)

上了离散数学,上了马原

45(11.25)

上了工程实训,上了英语视听说

Python模块与包完全教程:从导入到封装发布(附实战)

模块(Module)和包(Package)是Python代码组织与复用的核心机制——模块让你告别“复制粘贴代码”,包让你能系统化管理多个模块。本文从零基础视角出发,详解模块的导入、自定义、包的创建与使用,甚至延伸到包的封…

29(11.3)

上了Java课,受益匪浅

[豪の算法奇妙冒险] 代码随想录算法训练营第八天 | 344-反转字符串、541-反转字符串II、Carl54-替换数字

LeetCode344 反转字符串、LeetCode541 反转字符串II、Carl54 替换数字代码随想录算法训练营第八天 | 344-反转字符串、541-反转字符串II、Carl54-替换数字LeetCode344 反转字符串题目链接:https://leetcode.cn/proble…

【Webpack连载一】入门简介。了解为什么需要Webpack,解决哪些开发中通病 - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

31(11.5)

上了离散数学,上了马原

26 10.29

学习打游戏跑步

深入解析:GitLab 钩子 + Jenkins 自动化构建项目

深入解析:GitLab 钩子 + Jenkins 自动化构建项目pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas",…

27.10.30

上了数据结构课程,上了体育课

抖音a_bogus,mstoken全参数爬虫逆向补环境2024-06-15

抖音a_bogus,mstoken全参数爬虫逆向补环境2024-06-15https://www.cnblogs.com/dy9527/p/19057109

深度学习50问

深度学习50问 一、深度学习基础(数学与本质)为什么深度神经网络具有“通用逼近能力”?它的局限性是什么? 深度模型为什么能泛化?泛化从何而来?为什么过参数化反而更容易泛化? 解释一下梯度消失与梯度爆炸的数学…

借助gdb推进修改oracle scn

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年11月红外防潮系统,碳红外防潮取暖系统,别墅红外防潮系统厂家推荐:实力防潮品牌解析,采购无忧之选!

2025年11月:碳红外防潮取暖系统,别墅防潮之优质之选在别墅居住体验中,防潮问题一直是困扰众多业主的难题。尤其是在一些气候湿润的地区,别墅地下室等空间容易出现潮湿发霉的情况,不仅影响房屋的美观和使用寿命,还…