NLP未来,路在何方?从学术前沿和业界热点谈起

近两年,人工智能的应用越来越“卷”了,每隔一段时间就会出现一个让人大呼“respect”的技术。

AI好像也更加懂人类,越来越接近“人的智能”。

就好比今年高考期间被各大科技媒体反复拿来讲的AI高考的案例。如今的“AI做题家”不光能参加高考,还能挑战本科生甚至研究生。比如,来自OpenAI的Codex在麻省理工学院的高数课程题目中正确率达到了81.1%,说能比肩顶尖学府本科生水平也不为过。

75ce6ed49a805be19465f65b80e0cb04.png

像AI实时翻译这种能力尽管之前翻车的不少,但对于它的商业化,行业的预期非常明确。在跨国会议中看到不同国家的参会者,操着不同的语言,无障碍进行交流的场景,已经不是遥不可及的想象。

8b67421cb51129ac001246a68803b644.jpeg

聊天机器人的表现也不再仅仅是机械式的一问一答,有的已经可以感知情感,能分析情绪并给出相应的反馈。让虚拟偶像具备情感陪伴的能力也是大热的落地方向之一。

这些应用的背后都离不开自然语言处理(NLP)技术的不断精进。

再说说前不久被科技圈津津乐道的“东方名画”——虎戴VR。脑洞大开的外国网友,不按套路向谷歌人工智能作画系统Imagen,输送了指令:给宋代的东方老虎佩戴VR。结果产生了一系列毫无违和感的作品,谁看了都得说一声:谷歌,牛X!

b83f5dcbf34aaf4b426d5cdf280cb353.jpeg

Imagen是目前人工智能多模态理解与创作的集大成者,但这套模型对人类指令的精准识别和理解,背后发挥作用的同样是NLP

可以说,要让人工智能更像“人的智能”,就躲不开语言理解和语言处理这个大热的方向。

NLP领域目前有哪些亟待突破的技术问题?长文本的语言处理的技术难点在哪里?面向开放域问答的自适应信息检索如何精益求精?NLP技术如何在小红书这样的复杂UGC内容社区中应用和落地?

想要得到这些问题的解答,你一定不能错过小红书技术团队出品的《REDtech 来了》系列第三期技术直播。8月5日19:00,小红书将邀请业内顶尖专家和大家一同探讨“自然语言处理的前沿与实践”。

dbd7e09e82c87b43297584a561e4993e.png

60fbeff46a94f0b97507c18b9b33a499.png

除了张岳、庞亮两位学界大牛的分享干货满满之外,小红书社区搜索文本理解负责人曾书和小红书技术模型负责人王树森分享的小红书所面临的NLP问题和实践将会是第一手的工业界案例分享,同样不容错过。

2c52767f63e64b13cde3e51df402a59b.png

1f9ddd81a611fbc8cba3793ba0f7e4fe.png

作为国内独树一帜的内容社区,截至 2021 年10 月,小红书APP月活跃用户数已经超过 2 亿。小红书最大的特色在于其社区内容以UGC为主,且内容多以音视频+图文的多模态呈现,这对文本和内容的理解提出了更高的要求。

小红书对于用户内容去中心化的分发机制,也决定了在算法中对内容本身的理解占据了更大的比重,而不是简单依赖于对用户行为的分析。

海量UGC内容还带来了非标化的问题,最常见的案例就是对比喻义和引申义的理解。

当一个用户看到一片令人心旷神怡的草地,他拍下照片并记录“仿佛置身于塞尔达旷野之息”。算法该如何理解这里的这篇笔记的核心内容,如何判断哪些用户会喜欢这篇笔记?

再比如在一篇旅行笔记中,用户把一座海边的渔村称作“福建小希腊”,当其他用户用“希腊”作为关键词搜索时,这篇笔记是否该出现,何时出现——这背后都是复杂的NLP问题。

对于这些问题,小红书会尝试哪些更好的解决方式?小红书的业务场景和数据还可以孕育哪些令人激动的技术问题?相信在8月5日晚的这场直播中也将找到答案。

3efcea9796060dac5bded5db46fe624f.jpeg

直播收看攻略:

时间:2022 年 8 月 5 日(周五)19:00-21:00

直播平台:关注【小红书技术 REDtech 】视频号,预约直播,不见不散。(直播也将在抖音与B站同步进行,搜索“小红书技术 REDtech ”)

👇扫描下方二维码进入直播交流群,将第一时间获取直播链接及开播提醒。

3380f7146a69a6c46ac35b4fbc2003ae.jpeg

我们将在微信群内发布嘉宾演讲精华和抽奖活动, 参与互动提问还有机会被嘉宾pick解答哦。

目前,小红书REDstar顶尖技术人才招聘计划已经正式启动。“REDstar“是小红书面向全球高校顶尖技术人才发起的专属人才招聘计划,将为REDstar提供有行业竞争力的薪酬福利、极富诚意的专属培养方案以及敢于提拔年轻人的实践通道。诚挚地邀请各技术领域的优秀同学加入,一起用技术让生活变得更加美好!

REDstar项目期间,锁定小红书技术分享直播间,开拓前沿技术视野,深入了解小红书技术团队的真实业务场景和技术氛围。提前入群还有机会获得与专家直接互动机会。

点击阅读原文,成为REDstar

即刻投递,抢占先机!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477093.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剑指Offer - 面试题46. 把数字翻译成字符串(DP)

1. 题目 给定一个数字,我们按照如下规则把它翻译为字符串: 0 翻译成 “a” , 1 翻译成 “b”,……, 11 翻译成 “l”,……, 25 翻译成 “z”。 一个数字可能有多个翻译。请编程实现一个函数&a…

美团数据库运维自动化系统构建之路

本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和…

推荐一个开源的炼丹神器MegPeak!算法工程师的仪表盘

在算力需求爆炸的大背景下,如何发挥出已有硬件的最大算力变得非常重要,直观一点是:我们需要对现有算法针对特定的处理器进行极致的性能优化,尽量满足目前AI算法对算力的高要求。为了能够做到极致的性能优化,我们可能的…

LintCode 390. 找峰值 II

1. 题目 给定一个整数矩阵 A, 它有如下特性: 相邻的整数不同矩阵有 n 行 m 列。对于所有的 i < n, 都有 A[i][0] < A[i][1] && A[i][m - 2] > A[i][m - 1]对于所有的 j < m, 都有 A[0][j] < A[1][j] && A[n - 2][j] > A[n - 1][j] 我们定…

Node.js Stream - 实战篇

前面两篇&#xff08;基础篇和进阶篇&#xff09;主要介绍流的基本用法和原理&#xff0c;本篇从应用的角度&#xff0c;介绍如何使用管道进行程序设计&#xff0c;主要内容包括&#xff1a; 管道的概念Browserify的管道设计Gulp的管道设计两种管道设计模式比较实例所谓“管道”…

我们的Web3创业项目,黄了

文 | 邬宇琛源 | 投资界PEdaily这是今年VC圈最具争议的赛道&#xff0c;如今也可能是熄灭最快的赛道。三个月&#xff0c;换了三个方向。今年春天&#xff0c;北京某出海互联网公司在内部筹划起一个新的项目&#xff0c;项目直指风口——Web3。毫无Web3经验的互联网运营经理吴欣…

决策树(Decision Tree,DT)

文章目录1. 决策树模型与学习2. 特征选择2.1 特征选择Python代码3. 决策树的生成3.1 Python代码4. 决策树的剪枝5. CART 算法6. sklearn 例子6.1 书上贷款例子6.2 鸢尾花 及 决策树可视化附. 本文完整代码决策树&#xff08;decision tree&#xff09;是一种基本的分类与回归方…

使用模板快速编写测试用例

在高速发展的互联网公司&#xff0c;由于产品的开发迭代太快&#xff0c;产品测试经常遇到以下几个问题&#xff1a; 1. 如何在快速的产品开发迭代中迅速地完成对产品功能的测试&#xff1f; 2. 面对用户众多、环境多样&#xff0c;如何尽可能地测试全面&#xff1f; 3. 公司扩…

最新!Kaggle所有竞赛开源方案和Top思路汇总,共477场竞赛!

数据竞赛能帮助我们快速提升数据分析和建模能力&#xff0c;非常多的朋友也非常希望学习Top比赛的方案。之前也有非常多的朋友问我某某竞赛的方案有没有&#xff0c;有时我不是很忙的时候就会把对应的竞赛中把Top的链接找出来一起整理发过去&#xff0c;但也有的时候可能会比较…

LeetCode 65. 有效数字(逻辑题,难)

1. 题目 验证给定的字符串是否可以解释为十进制数字。 例如: "0" > true " 0.1 " > true "abc" > false "1 a" > false "2e10" > true " -90e3 " > true " 1e" > false "…

Mock Server实践

背景 在美团服务端测试中&#xff0c;被测服务通常依赖于一系列的外部模块&#xff0c;被测服务与外部模块间通过REST API或是Thrift调用来进行通信。要对被测服务进行系统测试&#xff0c;一般做法是&#xff0c;部署好所有外部依赖模块&#xff0c;由被测服务直接调用。然而有…

美团上交开源PromptDet:无需标注,开放世界的目标检测器

文 | 冯承健源 | 极市平台本文提出了一个开放世界的目标检测器PromptDet&#xff0c;它能够在没有任何手动标注的情况下检测新类别&#xff08;如下图绿色检测框&#xff09;&#xff0c;其中提出区域prompt学习方法和针对网络图像的自训练方法&#xff0c;性能表现SOTA。主页&…

Docker系列之二:基于容器的自动构建

自动构建系统是从美团的自动部署系统发展出来的一个新功能。每当开发人员提交代码到仓库后&#xff0c;系统会自动根据开发人员定制的构建配置&#xff0c;启动新的Docker容器&#xff0c;在其中对源代码进行构建&#xff08;build&#xff09;&#xff0c;包括编译&#xff08…

剑指Offer - 面试题56 - I. 数组中数字出现的次数(异或,分组)

1. 题目 一个整型数组 nums 里除两个数字之外&#xff0c;其他数字都出现了两次。请写程序找出这两个只出现一次的数字。 要求时间复杂度是O(n)&#xff0c;空间复杂度是O(1)。 示例 1&#xff1a; 输入&#xff1a;nums [4,1,4,6] 输出&#xff1a;[1,6] 或 [6,1]示例 2&a…

自动驾驶技术简史

文 | Bernard_Han自动驾驶是一个最近在产业界炙手可热的关键词。无论是与人工智能相关的顶级会议还是各大造车厂商甚至各大投资商都为这个成长初期的蓝海产业下注了美好的未来。但是“汽车自动化”的理论与自动驾驶不同&#xff0c;提出至今已有近百年的历史。从最初的遥控到如…

你是什么时候对深度学习失去信心的?

文 | 霍华德源 | 知乎最近几天在知乎上有个问题火了&#xff1a;你是什么时候对深度学习失去信心的&#xff1f;在此推荐一下知乎大V霍华德的回答&#xff0c;以下为原回答。对于深度学习的现状&#xff0c;工业界还是很清楚的。如果没有变革性的突破&#xff0c;弱人工智能时代…

OpenTSDB 造成 Hbase 整点压力过大问题的排查和解决

业务背景 OpenTSDB 是一款非常适合存储海量时间序列数据的开源软件&#xff0c;使用 HBase 作为存储让它变的非常容易扩展。我们在建设美团性能监控平台的过程中&#xff0c;每天需要处理数以亿计的数据&#xff0c;经过几番探索和调研&#xff0c;最终选取了 OpenTSDB 作为数据…

LintCode 183. 木材加工(二分查找)

1. 题目 有一些原木&#xff0c;现在想把这些木头切割成一些长度相同的小段木头&#xff0c;需要得到的小段的数目至少为 k。当然&#xff0c;我们希望得到的小段越长越好&#xff0c;你需要计算能够得到的小段木头的最大长度。 样例 1 输入: L [232, 124, 456] k 7 输出: …

AC算法在美团上单系统的应用

1.背景 在美团&#xff0c;为了保证单子质量&#xff0c;需要对上单系统创建的每一个产品进行审核。为了提高效率&#xff0c;审核人员积累提炼出了一套关键词库&#xff0c;先基于该词库进行自动审核过滤&#xff0c;对于不包括这些关键词的产品信息不再需要进行人工审核。因此…

LintCode 600. 包裹黑色像素点的最小矩形(BFS)

1. 题目 一个由二进制矩阵表示的图&#xff0c;0 表示白色像素点&#xff0c;1 表示黑色像素点。 黑色像素点是联通的&#xff0c;即只有一块黑色区域。 像素是水平和竖直连接的&#xff0c;给一个黑色像素点的坐标 (x, y) &#xff0c;返回囊括所有黑色像素点的矩阵的最小面积…