番禺区怎么做网站建设凡科轻站小程序怎么样
news/
2025/9/24 6:29:59/
文章来源:
番禺区怎么做网站建设,凡科轻站小程序怎么样,手机好在百度做网站吗,怎么做照片网站转载自 哈工大刘挺教授#xff1a;自然语言处理的十个发展趋势
近日#xff0c;由中国人工智能学会、阿里巴巴集团 蚂蚁金服主办#xff0c;CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会#xff08;CCAI 2017#xff09;在杭州国际会议中心盛大开幕…转载自 哈工大刘挺教授自然语言处理的十个发展趋势
近日由中国人工智能学会、阿里巴巴集团 蚂蚁金服主办CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会CCAI 2017在杭州国际会议中心盛大开幕。
本次大会的第一场分论坛讨论是关于语言智能领域的八大问题。讨论期间哈尔滨工业大学刘挺教授对自然语言处理的发展趋势做了一次精彩的归纳他把这里的趋势分成了十个方面。 哈尔滨工业大学教授刘挺
趋势1语义表示——从符号表示到分布表示 自然语言处理一直以来都是比较抽象的都是直接用词汇和符号来表达概念。但是使用符号存在一个问题比如两个词它们的词性相近但词形不匹配计算机内部就会认为它们是两个词。举个例子荷兰和苏格兰这两个国家名如果我们在一个语义的空间里用词汇与词汇组合的方法把它表示为连续、低维、稠密的向量的话就可以计算不同层次的语言单元之间的相似度。这种方法同时也可以被神经网络直接使用是这个领域的一个重要的变化。
从词汇间的组合到短语、句子一直到篇章现在有很多人在做这个事这和以前的思路是完全不一样的。
有了这种方法之后再用深度学习就带来了一个很大的转变。原来我们认为自然语言处理要分成几个层次但是就句法分析来说它是人为定义的层次那它是不是一定必要的这里应该打一个问号。 实际工作中我们面临着一个课题——信息抽取。我之前和一个单位合作初衷是我做句法分析然后他们在我的基础上做信息抽取相互配合后来他们发表了一篇论文与初衷是相悖的它证明了没有句法分析也可以直接做端到端的直接的实体关系抽取
这很震撼不是说现在句法分析没用了而是我们认为句法分析是人为定义的层次在端到端的数据量非常充分可以直接进行信息抽取的时候那么不用句法分析也能达到类似的效果。当端到端的数据不充分时才需要人为划分层次。
趋势2学习模式——从浅层学习到深度学习 浅层到深层的学习模式中浅层是分步骤走可能每一步都用了深度学习的方法实际上各个步骤是串接起来的。直接的深度学习是一步到位的端到端在这个过程中我们确实可以看到一些人为贡献的知识包括该分几层每层的表示形式一些规则等但我们所谓的知识在深度学习里所占的比重确实减小了主要体现在对深度学习网络结构的调整。
趋势3NLP平台化——从封闭走向开放 以前我们搞研究的都不是很愿意分享自己的成果像程序或是数据现在这些资料彻底开放了无论是学校还是大企业都更多地提供平台。NLP领域提供的开放平台越来越多它的门槛也越来越降低。
语音和语言其实有很大的差别我认识的好几位国内外的进入NLP的学者他们发现NLP很复杂因为像语音识别和语音合成等只有有限的问题而且这些问题定义非常清晰。但到了自然语言要处理的问题变得纷繁复杂尤其是NLP和其他的领域还会有所结合所以问题非常琐碎。
趋势4语言知识——从人工构建到自动构建 AlphaGo告诉我们没有围棋高手介入他的开发过程,到AlphaGo最后的版本它已经不怎么需要看棋谱了。所以AlphaGo在学习和使用过程中都有可能会超出人的想像因为它并不是简单地跟人学习。 美国有一家文艺复兴公司它做金融领域的预测但是这个公司不招金融领域的人只是招计算机、物理、数学领域的人。这就给了我们一个启发计算机不是跟人的顶级高手学而是用自己已有的算法去直接解决问题。
但是在自然语言处理领域还是要有大量的显性知识的但是构造知识的方式也在产生变化。比如现在我们开始用自动的方法自动地去发现词汇与词汇之间的关系像毛细血管一样渗透到各个方面。
趋势5对话机器人——从通用到场景化 最近出现了各种图灵测试的翻版就是做知识抢答赛来验证人工智能从产学研应用上来讲就是对话机器人非常有趣味性和实用价值。
这块的趋势在哪里我们知道从Siri刚出来国内就开始做语音助手了后来语音助手很快下了马因为它可以听得到但是听不懂导致后面的服务跟不上。后来国内把难度降低成了聊天你不是调戏Siri吗我就做小冰就跟你聊。但是难度降低了实用性却跟不上来所以在用户的留存率上还是要打个问号。
现在更多的做法和场景结合降低难度然后做任务执行即希望做特定场景时的有用的人机对话。在做人机对话的过程中大家热情一轮比一轮高涨但是随后大家发现很多问题是由于自然语言的理解没有到位才难以产生真正的突破。
趋势6文本理解与推理——从浅层分析向深度理解迈进 Google等都已经推出了这样的测试机——以阅读理解作为一个深入探索自然语言理解的平台。就是说给计算机一篇文章让它去理解然后人问计算机各种问题看计算机是否能回答这样做是很有难度的因为答案就在这文章里面人会很刁钻地问计算机。所以说阅读理解是现在竞争的一个很重要的点。
趋势7文本情感分析——从事实性文本到情感文本 多年以前很多人都在做新闻领域的事实性文本而如今搞情感文本分析的似乎更受群众欢迎这一块这在商业和政府舆情上也都有很好地应用。
趋势8社会媒体处理——从传统媒体到社交媒体 相应的在社会媒体处理上从传统媒体到社交媒体的过渡情感的影响是一方面大家还会用社交媒体做电影票房的预测做股票的预测等等。
但是从长远的角度看社会、人文等的学科与计算机学科的结合是历史性的。比如在文学、历史学等学科中有相当一部分新锐学者对本门学科的计算机的大数据非常关心这两者在碰撞未来的前景是无限的而自然语言处理是其中重要的、基础性的技术。
趋势9文本生成——从规范文本到自由文本 文本生成这两年很火从生成古诗词到生成新闻报道到再到写作文。这方面的研究价值是很大的它的趋势是从生成规范性的文本到生成自由文本。比如我们可以从数据库里面生成一个可以模板化的体育报道这个模板是很规范的。然后我们可以再向自由文本过渡比如写作文。
趋势10NLP行业——与领域深度结合为行业创造价值 最后是谈与企业的合作。现在像银行、电器、医药、司法、教育、金融等的各个领域对NLP的需求都非常多。
我预测NLP首先是会在信息准备的充分的并且服务方式本身就是知识和信息的领域产生突破。还比如司法领域它的服务本身也有信息它就会首先使用NLP。NLP最主要将会用在以下四个领域医疗、金融、教育和司法。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/915080.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!