全世界都在说中国话?2022国际大数据竞赛首次以“中文”命题

8月10日, IKCEST第四届“一带一路”国际大数据竞赛暨第八届百度&西安交大大数据竞赛(以下简称“国际大数据竞赛”)正式启动,本届赛题聚焦“低资源语言机器翻译”行业难题,向全球开发者发出邀请。

百度发布稀缺语种任务 挑战机器翻译难题

截至今年5月,我国签署的“一带一路”合作文件涉及110多种语言,沿线国家和地区在经济发展、民生改善等方面的合作日趋深入,对多语言翻译的需求快速增长。

本届大赛赛题——“一带一路”低资源语言翻译,重点关注法、俄、泰、阿与中文的互译,突破了国际机器翻译以英文为中心的评测惯例,旨在鼓励全球青年挑战低资源机器翻译任务,融入“一带一路”建设。

“帮助人们跨越语言鸿沟,与世界自由沟通”是百度翻译一直以来的愿景。自2010年开始研发机器翻译以来,百度在多语言翻译、多模态机器翻译等核心技术以及产品方面持续创新。如今,百度翻译已经支持超过200种语言互译,可以支持文本、语音、图片与文档翻译,每日翻译超过千亿字符,服务全球用户。百度技术委员会主席吴华表示,“百度翻译致力于帮助人们与世界自由沟通”,这正是本届赛题的技术基因。

顶级赛事 邀请逐梦青年推动全球互联互通

国际大数据竞赛于2015年由百度和西安交通大学联合创办,鼓励选手用AI技术解决现实问题。2019年,百度与IKCEST、西安交通大学、丝绸之路大学联盟合作,将大赛升级为国际赛事。

53f77d95959baec9e380cc55f69e8183.png

启动仪式上,中国工程院国际合作局局长、IKCEST常务副主任田琦指出,本届大赛致力于提升“一带一路”重要语言的机器翻译质量,意义重大,他期待越来越多逐梦青年加入到推动全球互联互通、创新发展的行列中来。

印度科学院院士、IKCEST理事会成员N.巴拉克里斯南(Narayanaswamy Balakrishnan)表示,“这次比赛将让全球更加靠近‘类人机器翻译’的目标。”

回顾大赛8年历程,西安交通大学常务副校长郑庆华教授以“三个飞跃”概括:从国内竞赛到全球大赛的级别飞跃;从几十所高校到上万支队伍的规模飞跃;从单一的人工智能大数据算法到综合型、创新型、设计型的内容飞跃。

以赛促创 产学研合力完善AI人才培养生态

本届大赛采用机器翻译主流的BLEU评价指标。初赛阶段,选手们将得到中法、中俄、中泰各10万句对作为训练数据。复赛阶段,以中阿5万句作为训练数据。复赛排名前16的队伍,进入决赛,现场答辩。

4faec3769dfb22da68fad3f437c2c9a6.png

百度将为选手提供基于PaddlePaddle的基准模型以及免费、高性能算力支持。国内知名语言服务解决方案提供商译马网提供部分语料数据。本届大赛的所有数据集均会于赛后在“千言开源数据集”平台(https://www.luge.ai)持续开放,助力更多AI人才投入产业研发,促进技术进步。

国际大数据竞赛初赛报名截止时间为2022年9月30日,详情请登录竞赛官网(https://www.ikcest.org/bigdata2022)。

点击“阅读原文”,前往赛事官网查看详情及报名。扫描下方二维码,即可加入「2022国际大数据竞赛群」!

490f3092afa7adf05ee8c27beaee7809.png

QQ:713923520

(请注明参赛队名,由管理员审核通过)

百度自然语言处理(Natural Language Processing,NLP)以『理解语言,拥有智能,改变世界』为使命,研发自然语言处理核心技术,打造领先的技术平台和创新产品,服务全球用户,让复杂的世界更简单。

a8226d23b76aefaed825265a591e1614.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477022.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昨天发烧了……

唉,真是天有不测风云啊……发烧原因不明……转载于:https://www.cnblogs.com/wonderow/archive/2005/01/20/94699.html

LeetCode 51. N皇后 / 52. N皇后 II(回溯)

1. 题目 n 皇后问题研究的是如何将 n 个皇后放置在 nn 的棋盘上,并且使皇后彼此之间不能相互攻击。 上图为 8 皇后问题的一种解法。 给定一个整数 n,返回所有不同的 n 皇后问题的解决方案。 每一种解法包含一个明确的 n 皇后问题的棋子放置方案&…

我的新书《Spring Cloud实战》预告

从去年6月开始编写《Spring Cloud构建微服务架构》系列博文开始,受到了不少同行的关注与支持。随后也开通了多个交流群、创建了相关的论坛(http://bbs.springcloud.cn),虽然Spring Cloud在国内变得越来越火热,但是这一…

GPT-3 泄露了我的真实姓名

文 | 天于刀刀世界上总有这么一群人,他们是高智商科技狂,是新时代技术热点的弄潮儿,更是充满神秘感潜藏在里世界默默注视着时代发展的极客。而 Hacker News 这一网站致力于提供最新国际威胁情报、黑客动向以及维基解密资讯,让我们…

Gmail的另类浏览法--RSS

RSS 眼下大行其道,虽然RSS在技术上没有什么最尖端、最高新的突破,不过是对信息的时序做了一些处理,但很恰当地调整了人们获取信息的方式,使得信息的获得变得集中、主动和异步。 集中:可供订阅的聚合一般都是某个主题相…

LintCode 1210. 升序子序列(DFS)

1. 题目 给定一个整数数组,找到所有不同的可能的升序子序列,一个升序子序列的长度至少应为2。 例1: 输入: [4,6,7,7] 输出: [[4,6],[4,6,7],[4,6,7,7],[4,7],[4,7,7],[6,7],[6,7,7],[7,7]]例2: 输入: [65,21,-44,31,-8] 输出: [[-44,-8],[-44,31],[21,…

GPT3=魔鬼搜索引擎?从一个隐私血案说起...

世界上总有这么一群人,他们是高智商科技狂,是新时代技术热点的弄潮儿,更是充满神秘感潜藏在里世界默默注视着时代发展的极客。而 Hacker News 这一网站致力于提供最新国际威胁情报、黑客动向以及维基解密资讯,让我们得以一窥这个灰…

Spring Cloud构建微服务架构(五)服务网关

通过之前几篇Spring Cloud中几个核心组件的介绍,我们已经可以构建一个简略的(不够完善)微服务架构了。比如下图所示: 我们使用Spring Cloud Netflix中的Eureka实现了服务注册中心以及服务注册与发现;而服务间通过Ribbo…

去除任务栏的图标

这次我要对付的软件是一个比较好用的代理软件(我不知道这样文章要不要隐藏文件名称),算法大家已经分析很多次了,我就不再重复了. 我这里来讨论一个实际应用的问题:如果你想用别人的机器上网而又不想让他轻易的发现(好像这样的想法大家都有吧?).而这个软件在启动之后 会在任务栏…

LintCode 1353. 根节点到叶节点求和(DFS)

1. 题目 给定仅包含来自0-9的数字的二叉树,每个根到叶路径可以表示数字。 举个例子:root-to-leaf路径1-> 2-> 3,它代表数字123,找到所有根到叶的数的总和 样例1 输入: {1,2,3} 输出: 25 解释:1/ \2 3 路径 1->2 表示…

1 亿巨资开发的防疫 APP,两年多只找到 2 例确诊

源 | 观察者网2020 年 4 月,澳政府斥巨资打造防疫 APP“COVIDSafe”。两年多过去了,这款曾被寄予厚望、当作通向防疫成功“门票”的 APP 寿命将近,于当地时间 8 月 9 日宣布将在不久后停用。澳大利亚卫生部长巴特勒(Mark Butler&a…

Sql 实现自动添加行数标记

select IDENTITY(int,1,1) as NameID,* into #t from MissionAssignView select * from #t order by NameID drop table #t 转载于:https://www.cnblogs.com/jhtchina/archive/2005/03/09/115532.html

Spring Boot 2.x基础教程:使用JdbcTemplate访问MySQL数据库

在第2章节中,我们介绍了如何通过Spring Boot来实现HTTP接口,以及围绕HTTP接口相关的单元测试、文档生成等实用技能。但是,这些内容还不足以帮助我们构建一个动态应用的服务端程序。不论我们是要做App、小程序、还是传统的Web站点,…

程序员面试金典 - 面试题 03.01. 三合一(数组栈)

1. 题目 三合一。描述如何只用一个数组来实现三个栈。 你应该实现push(stackNum, value)、pop(stackNum)、isEmpty(stackNum)、peek(stackNum)方法。stackNum 表示栈下标,value 表示压入的值。 构造函数会传入一个stackSize参数,代表每个栈的大小。 …

谷歌:级联语言模型是通用推理系统的未来

文 | ZenMoore前言相信每个 NLPer 心中都有对 Reasoning 的一片期冀。当初笔者进入 NLP 的大门,就是相信:由于语言强大的表达能力以及语言模型强大的建模能力,Reasoning 一定就在不久的将来!可惜实际情况却是......[流泪]直到我看…

Hibernate+mysql 中文问题解决方案.

1, mysql安装时设置字符集utf-8, jdbc驱动3.0.15以上. 2. hibernate配置文件中,加上属性 <property name"connection.useUnicode">true</property> <property name"connection.characterEncoding">UTF-8</property> 3. web.xml设置…

Spring Boot 2.x基础教程:Swagger静态文档的生成

前言 通过之前的两篇关于Swagger入门以及具体使用细节的介绍之后&#xff0c;我们已经能够轻松地为Spring MVC的Web项目自动构建出API文档了。如果您还不熟悉这块&#xff0c;可以先阅读&#xff1a; Spring Boot 2.x基础教程&#xff1a;使用Swagger2构建强大的API文档Sprin…

LintCode 802. 数独(回溯)/ LeetCode 37. 解数独

1. 题目 编写一个程序&#xff0c;通过填充空单元来解决数独难题。 空单元由数字0表示。 你可以认为只有一个唯一的解决方案。 LeetCode 37 题类似&#xff0c;把 int 改成 char&#xff0c;注意转换 2. 解题 行、列、小9宫格内 1-9 都只出现一次暴力回溯&#xff0c;坐标转…

完爆GPT3、谷歌PaLM!检索增强模型Atlas刷新知识类小样本任务SOTA

文 | 小戏不知不觉间&#xff0c;大模型小样本成为了小样本学习领域的主流打法&#xff0c;在许多的任务背景下&#xff0c;一套通用的思路是先标注小数据样本&#xff0c;再从预训练大模型的基础上使用小数据样本进行训练。尽管如我们所见&#xff0c;大模型在一众小样本学习的…

简单的分页类

<% LanguageVBScript %><% Option Explicit %><SCRIPT LANGUAGEVBScript RUNATSERVER> 确保引用 ADO Typelib 或使用 ADOVBS.Inc Dim iPageNum, iRowsPerPage Main Sub Main() Dim rst Dim sSQL, sConnString If Request.QueryString("iPageNu…