沉痛悼念!中国NLP 先行者、机器翻译鼻祖刘倬逝世

e34aa0386c8550cc836691eb9d0ff706.png

作者 | 李梅
编辑 | 陈彩娴
来源 | AI科技评论

AI 科技评论获悉,中国机器翻译事业的开创者之一、原中国社科院语言研究所研究员刘倬老师与世长辞,享年 89 岁。沉痛悼念刘倬老师!

628393de3829ed377e46bdd21e823539.png

刘倬,1933 年 4 月 4 日生于河北省大成县。1949 年从北京市立一中毕业后,他进入华北大学学习,同年11月被分配到哈尔滨外专学习俄语,1951 年毕业后留校任助教。1953 年,他被调入北京高等教育部,在综合大学司任科员。1954 年至 1960 年间,他在北京俄语学院任语言学讲师。

自 1960 年11月起,刘倬加入中国社会科学院语言研究所,从事机器翻译的研究和开发,直至 1998 年离休。在职期间,他曾担任语言研究所学术委员会委员、中国语言学会会员、中国中文信息学会常务理事、自然处理专业委员会主任。

1 中国机器翻译先行者

刘倬先生在机器翻译事业中最重要的代表作品之一,是他在 1964 年与刘涌泉、高祖舜合作出版的《机器翻译浅说》一书,该书论述了汉外机器翻译系统的研制方法。

29a85af561cddac4f5c59885dc08e05b.png

58 年前,三位作者在这本书中对未来机器翻译的发展和应用展开畅想:

“有一天,当你在北京人民大会堂和世界各国友人聚会的时候,你会发现,无论哪个国家的人在台上讲话,与会者都能从耳机里听到自己国家的语言……”

从本书的出版算起,我国的自然语言处理研究已历经了半个多世纪的发展和演变,沟通无国界的梦想在今天正在逐步实现,这离不开刘倬等老一辈自然语言处理学者的多年耕耘。

刘倬与本书的另一位作者刘涌泉并称中国机器翻译领域的“二刘”。刘涌泉曾于 1958 年发表中国学者的第一篇机器翻译论文《俄汉机器翻译中的词序问题及其解决办法》,他主持的俄汉机器翻译项目于 1959 年在计算所 104 机上试验成功,从而使得中国成为世界上第五个进行机器翻译试验的国家。刘倬与刘涌泉两位前辈在社科院语言研究所共同从事机器翻译研究,为后来 NLP 的发展做出了许多奠定性的贡献。

参与“二刘”机器翻译项目的还有另一位中国早期计算语言学的推动者、著名语言信息处理技术专家——冯志伟。

在冯志伟的机器翻译研究生涯中,刘倬和刘涌泉给予了他巨大支持。《机器翻译浅说》发布后不久,全世界的机器翻译进入一个低谷期,中国的机器翻译也停滞了 10 多年,直到 20 世纪 70 年代后期人工智能第二次浪潮,机器翻译再次复兴。此时冯志伟接过“二刘”的班,以中国科学技术大学研究生院信息科学系研究生的方式挂在刘涌泉名下,期间赴法国进修,于 1981 年回国。这时中国的机器翻译进入上升期,冯志伟回国后在家乡昆明组织举办了全国第一次机器翻译会议,刘倬和刘涌泉都在其中。1982 年,冯志伟在国际计算语言学大会(COLING)上发表论文,成为首次在 NLP 国际顶会上发表文章的中国学者。

冯志伟对刘倬先生的离世表示悼念:

中国机器翻译的开创人之一刘倬老师去世,享年89岁。我曾跟随刘倬老师一起研制高立机器翻译系统,得到刘老师的教诲,终生受益。刘倬老师千古!

2 基于规则的机器翻译技术创新者

在早期基于规则的符号机器翻译研究领域,刘倬作为一位先驱者,实现了多个关键的技术创新,例如把数据和程序分开的策略改变,从规则的固定表格模式处理推进到定义规则特定语言,赋能规则的自由书写,以及引入隐含常识的 ontology 知识库,个性与共性分离与交互技术,等等。

刘倬多年来在机器翻译领域的方法探索的集中体现,是他从 1975 年开始主持研制的 JFY 型英汉翻译系统。

JFY 型翻译系统是JFY-I型、II型、III型、IV 型翻译系统的总称,整套系统的研制前后共经历了十多年,凝结了刘倬多年来在机器翻译领域的思想探索。该系统基于专家词典,以实际应用为目标,结合语言学理论基础和算法设计,并通过大量语料的检验,最终实现了一个覆盖十几个专业领域的英汉科技文献翻译系统。

其中,JFY-I 型翻译系统(1976-1978)是套题录翻译系统,JFY-II 型翻译系统(1978-1980)是一套全文翻译系统,这两个系统是刘倬与中国科技情报研究所等单位共同研制的,其后的 JFY-III 型翻译系统(1980-1982)则是与中国军事科学院合作,这三个系统都是试验性的,  目的是在理论和技术上探索研制机器翻译规则系统的方法和经验。

从 JFY-IV 型翻译系统开始,便是商品化的应用系统。这个机译系统的设计从 1982 年开始,经历了三次重大的原则性改变,最终在 1987 年定型。刘倬对该系统的设计提出许多重要观点,如保持翻译系统的开放性,使语言规则的增、删、改简便易行;编制语言规则时注意结合共性与个性,把转换机制引入原文句型分析;在句法分析中采用以轴心词为中心的随机上下文分析法;等等。

为了创建一套方便实用的开发工具,刘倬亲自设计了一套 NLP 专用语言,即 JFY 语言,它是一种功能齐全且使用灵活的函数型产生式语言,用于实现JFY型机器翻译从解释器到控制器、从专家词典(个性规则)到句型转换(共性规则)的系统架构和流程。

在当时,中文机器翻译的难度比起西方语种的翻译难度要大得多,据当时受刘倬和刘涌泉共同指导、参与了系统研发的学生李维(前弘玑首席科学家、前讯飞 AI 研究院副院长,NLP 资深架构师)回忆,刘倬有一个绝技,可以不借用任何工具,凭着苦思冥想找到系统问题的所在。系统若有一个 bug,刘倬就睡不着,常常是半夜捉住 bug,第二天就迫不急待上机试验。如今的软件工程师大概很难想象,在当年没有任何纠错工具的开发环境下是怎样编码系统的。

经过多年运行和功能调拭,JFY-IV 型翻译系统的语言学理论基础和算法设计技术都被证明是正确且有效的,能够取得令人满意的翻译结果。

如今,中国的机器翻译事业以及自然语言处理学科都已步入世界前列,机器翻译技术不断迭代、创新,但刘倬先生所留下的诸多重要核心思想将经久不衰。

刘倬先生千古!

e1a38b4172957e2519ec732647163003.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 f3e3ee04667873a28cf078a8befd6235.png

[1] http://ling.cass.cn/xueren/xzjs/202110/t20211029_5370373.html

[2] https://liweinlp.com/?p=9103

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476927.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

今天很累……

今天,用了一整天时间去研究解决Tapestry3.0的StaleLinkException问题,可能太集中精神了,下午到了快下班的时候感到十分疲倦,眼睛有点痛。Todays Conclusion:天外有天,人上有人,任何时候都需要自…

如何 给给软件开发 添加 代理_如何与软件开发公司有效沟通

从最初的想法到可运行的软件,软件开发过程是十分繁杂的,既不想被细节淹没,又希望留有控制力,与软件开发公司沟通要如何做才能事半功倍呢?1,共享业务语义所谓业务语义,就是需求背后所思所想&…

LeetCode 1392. 最长快乐前缀(KMP)

1. 题目 「快乐前缀」是在原字符串中既是 非空 前缀也是后缀(不包括原字符串自身)的字符串。 给你一个字符串 s,请你返回它的 最长快乐前缀。 如果不存在满足题意的前缀,则返回一个空字符串。 示例 1: 输入&#x…

火到海外破圈!这个国产AI项目GitHub标星8.6k,价值千万

Q:最顶尖的AI技术到底离我们有多远? A:三行Python代码的距离。 导读 今天小编为大家推荐一个AI领域相当优秀的项目, 粗略估计,这个项目价值超过千万, 当前star 8.6k,大胆预判,这个项…

让互联网助小组合作一臂之力

利用互联网实现小组合作,目前显然还有诸多不便,原因何在?许多人都在网上实现了互联,小组合作似乎应该有诸多便利。但为什么维护一个可供小组其他成员共享和编辑的文件夹依然困难重重?为什么如果大家不使用相同的即时通…

程序员面试金典 - 面试题 10.05. 稀疏数组搜索(二分查找)

1. 题目 稀疏数组搜索。有个排好序的字符串数组,其中散布着一些空字符串,编写一种方法,找出给定字符串的位置。 示例1:输入: words ["at", "", "", "", "ball", "", "&…

颤抖吧,打工人!Meta研发裁员算法,Xsolla用AI模型打绩效??

撰稿丨千山审校丨云昭来源丨51CTO技术栈这几个月来,微软、谷歌、甲骨文、苹果等一众科技巨头纷纷裁员。日前,Meta成为又一家启动大规模裁员的科技公司。在这波裁员潮中,Meta的操作引起了诸多争议。争议焦点在于它将裁员的决定权“交”给了算法…

android制作相册浏览器_一分钟简单制作一个专属于自己的卡通头像

制作一个专属于自己的卡通头像很简单,我们常用的美图秀秀软件就可以轻松制作。首选在应用市场搜索美图秀秀下载后选择工具箱打开,找到实用工具中的动漫化身这个选项;打开后点击绘制动漫形象,可以在相册中选择一张提前保存好的头像…

用MS SQL Server事件探查器来跟踪数据库的操作

在MS SQL Server中,除了我们常用的企业管理器和查询分析器之外,还有一个非常有用的工具——事件探查器。由于这两天,我需要知道一个ASP.NET程序对某个数据库的哪些表进行了哪些操作,所以才发现了这个工具的好处! …

程序员面试金典 - 面试题 05.02. 二进制数转字符串(浮点型 转 二进制小数,乘2取整)

1. 题目 二进制数转字符串。给定一个介于0和1之间的实数(如0.72),类型为double,打印它的二进制表达式。 如果该数字不在0和1之间,或者无法精确地用32位以内的二进制表示,则打印“ERROR”。 示例1:输入&a…

blob数据类型_MySQL的数据类型

一,MySQL的数据类型数据类型是定义列中可以存储什么类型的数据以及该数据实际怎样存储的基本规则数据类型限制存储在数据列列中的数据。例如,数值数据类型列只能接受数值类型的的数据在设计表时,应该特别重视所用的数据类型。使用错误的数据类型可能会严…

仿真方面的文章

仿真方面的文章:献给初学者 promodel, em_plant离散事件系统仿真技术主要用于解决复杂系统管理中的决策问题,这里的管理具有广泛的意义,既可以是企业,工作的计划,调度和销售管理,也可以是导弹防御&#xff…

科技部发布新规:论文挂名属于学术不端,记入科研诚信数据库!

文 | 募格学术源 | 科技日报、科技部时隔三年后,《科研诚信案件调查处理规则(试行)》迎来修订版。9月14日,科技部、中央宣传部等二十二部门印发《科研失信行为调查处理规则》(以下简称《规则》)&#xff0c…

C++ 内存对齐 及 引用是否真的节省内存的一点思考

文章目录1. 内存对齐2. 递归中的内存对齐3. C引用的本质4. 致谢1. 内存对齐 通过以下语句&#xff0c;获取变量的占用内存打下&#xff1a; cout << "size of int " << sizeof(int) << endl; cout << "size of int& " <&…

小问题,对递归重复调用的改进,一起来分享

Problem设有一头小母牛&#xff0c;从出生第四年起每年生一头小母牛&#xff0c;按此规律&#xff0c;第N年时有几头母牛&#xff1f; Input本题有多组数据。每组数据只有一个整数N&#xff0c;独占一行。(1≤N≤50) Output对每组数据&#xff0c;输出一个整数&#xff08;独…

拦截游戏窗口被移动_Ruined King官网版-拳头rpg Ruined King游戏最新版下载v1.0

Ruined King是一款暗黑风格的动作冒险类手游&#xff0c;游戏采用回合制战斗方式为玩家进行呈现&#xff0c;多种强大的英雄需要玩家进行召集&#xff0c;大幅度提升角色的战斗力&#xff0c;丰富的任务等着玩家来完成&#xff0c;游戏中还有非常经典的剧情让玩家进行了解&…

AI开始卷高考了,英语已被卷到134分??

文 | 天于刀刀AI 真的太卷了&#xff01;不但模型之间互相卷&#xff0c;现在直接开始和人类学生一起卷高考了&#xff01;近期&#xff0c;来自 CMU 两位学者提出的重构预训练模型&#xff08;reStructured Pre-training, RST&#xff09;在只有 GPT-3 十六分之一参数量的情况…

(待解)静态构造器和静态字段调用的相互嵌套

示例代码&#xff1a;usingSystem;classA{ public static int X; static A() { X B.Y 1; }}classB{ public static int Y A.X 1; static B() {} static void Main() { Console.WriteLine("X {0}, Y {1}", A.X, B.Y); }}程序输出&#…

程序员面试金典 - 面试题 04.12. 求和路径(二叉树递归)

1. 题目 给定一棵二叉树&#xff0c;其中每个节点都含有一个整数数值(该值或正或负)。 设计一个算法&#xff0c;打印节点数值总和等于某个给定值的所有路径的数量。 注意&#xff0c;路径不一定非得从二叉树的根节点或叶节点开始或结束&#xff0c;但是其方向必须向下(只能…

一款三搭_冬日穿搭指南!照着这八条万能公式穿,让你不冻还有型_

就用我多年看搭配的经验为大家总结了8条万能公式&#xff01;想要做百岁老人的&#xff0c;冬天穿搭以下每一套都需要穿打底裤的哦&#xff01;&#xff01;&#xff01;公式一&#xff1a;大衣毛衣九分裤同色系袜子是画龙点睛之笔。同时大衣、毛衣和包包也是同色系&#xff0c…