我在斯坦福做的科研demo…要被导师带去美国国会演讲?

75b95394c6e10373bd2b2915e35066a5.png

文 | Jazon
编 | 小戏

大家好,我是 Jazon。时光荏苒,一转眼我已经快要从 Stanford CS 系毕业了。今年7月,我将开始谷歌总部工作,短期内会在硅谷定居,湾区的朋友们欢迎约起呀。

笔者去年写过一篇文章,分享了我研一时做的科研项目情况(推荐系统相关)。而进入研二,我于 2021 年 9 月加入了一个叫做“平台中间件”的新项目,做了半年。这是一个以社会变革为目标的,硬核的 NLP 应用项目,具体如何,且听我慢慢道来:

2b32f79d828c04cf219d3364e189a09c.png

背景:互联网平台与舆论仲裁

十六年前(2006年),Facebook 推出了 News Feed,这是在社交平台历史上的一个开创性的发明。News Feed 就是根据用户的喜好,在首页给用户展示推荐的帖子,用户可以无限下滑,查看更多帖子

98828b148f23579b4fec83f65785e032.png
▲图:Facebook News Feed示意图

后来这个“Feed”的模式被各种平台采用,从推特主页到各大新闻网站,几乎遍布我们生活的方方面面。然而,这个模式也带来了一些问题,其中包括:

(1)对于社会、政治类一些有争议的话题,是否应该由平台作为仲裁者,去审查过激言论、过滤不实信息,避免不好的帖子出现在用户的 Feed 里呢?

(2)平台拥有了影响舆论的权力,怎么确保平台不滥用这个权力,在 Feed 里给人们推送特定观点的帖子呢?

目标:变革人们接受信息的方式

针对上面的问题,我们提出“平台中间件”(Platform Middleware)的概念,其要义是——把 News Feed 的推荐算法去中心化,交给第三方去做。在目前的设想里,“中间件”的功能主要有:

(1)辨别敏感言论,并对这些帖子标记“左倾”或“右倾”分数、“争议性”分数;如果帖子包含仇恨言论等,可以选择不显示该帖子;

(2)对平台推荐的帖子,进行重新排名。

中间件”提供商会有很多,可能各自有自己的政治立场,用户可以自行选择使用哪个“中间件”的服务。这样一来,可以帮助实现舆论仲裁、信息传播的去中心化

75d188df6f88141cb81d44808e151e61.png
▲图:“中间件”对Twitter帖子的标记示意图

技术:强大的OpenAI API

前面提到,这个项目需要辨认有争议的言论、辨别言论是左倾还是右倾,涉及到 NLP 算法。不过我们自己不做建模,而是全部使用 OpenAIGPT-3,完成 NLP 相关任务。

OpenAI 为他们的 GPT-3 模型提供了公开的 API(https://beta.openai.com/docs/ ),可以付费使用。他们提供的 GPT-3 模型家族里,目前有 4 个“engine”可用,最好的 engineDavinci,它最强大,不过也最慢、价格最贵。而最基础的 engineAda

对于辨别文本“左倾还是右倾”的任务,我们主要试了下面 2 个 Endpoints

(1)Classification 文本分类:给定一个帖子、两个 Labels “Left” 和 “Right”,返回两个 Labels 对应的匹配度分数

(2)Completion 文本完成:给定一段文字,前面是一些例句,最后附上要分类的帖子文本,让 AI 完成文本,给出 “Left” 还是 “Right” 的判断

02880706c350230ea7184a878788c0f0.png
▲图:让GPT-3完成的文本示例,其中 s 是要归类的句子,放于例句之后

对比效果之后,我们采用了 Completion Endpoint,用文本完成的方式来做分类。它的准确率高得吓人,也让我体会到了 GPT-3 的强大。

我们还尝试、使用了其他公开的 API,比如用“Perspective API”来辨认仇恨言论等等。

导师:历史性大牛

项目的指导老师 Ashish Goel,是 Stanford 计算机系博士毕业,不过现在是管理工程系下的教授,十分全能。他之前在 Twitter 兼职做过科学家,负责了他们的推荐算法。

这个项目 Idea 的来源,是美国政治理论家福山(Francis Fukuyama),也是 Stanford 的教授。关注历史政治的朋友们可能知道,苏联倒台后,福山教授在 1992 年提出了著名的“历史终结论”,认为人类社会已经达到了终极组织形态,即西式民主,以后不会再有根本性变化。

这个理论当然很有争议,不过这不是本文的讨论范畴,也不影响福山教授是位大牛的事实。我17岁时就在网上读到过他,没想到在 Stanford 竟然可以和这样能载入史册的人物共事,真是神奇。

思考:科研不只技术的创新

在加入项目初期,我在写代码之外,也需要花时间主动了解 Project 的大格局、大目标,不然连自己应该干啥都不知道,容易做了一些事结果发现不是老师想要的。

11 月初,Stanford 搞了个 HAIHuman-centered AI)大会,主题是“Radical Policies for AI”(AI 的颠覆性政策)。Ashish 老师在会上发言,进一步阐述了我们的项目。我听着听着,突然意识到,这个科研项目,和我以往做的科研有本质的区别:

2e5bd6dd034ba9f0434c967cd11735bb.png
▲图:Ashish 老师在 HAI 大会上的报告

我们的最终目标是引领社会变革,而现在要做的是证明“技术可行性”。换句话说,主要目的不是创造新技术,而是运用已有技术,实现社会层面的改变

我想,之前我做过的科研大都关注在技术、方法的创新上,而很少认真思考这些新技术能怎样在微观、宏观上引导未来,改变社会,这种引导与改变从微观上讲是解决小众的需求,而从宏观上看就是影响大众的生活方式

当然,如何预测、把控未来,本就是一个无解的问题,但真正的大神还是能做一些基本的判断的。Ashish 不是空想家,在他的“中间件”设计蓝图里:

(1)考虑了加进“中间件”之后,如何维护社交平台现有的商业模式;

(2)阐述了如果要实现设想,国会和政策制定者应该怎么做;

(3)表示这个计划未来一定会调整、进化。

成果:为国会演说做准备

2022 年 2 月,我们搭好了模拟“中间件”的服务器和前端插件,初步做成了产品。经过各种 Presentation,我们不断汲取大家的反馈,不断调整设计、打磨效果,经过一次次迭代,终于完成了可行性演示。

未来,福山教授有计划带着我们做的 Demo,去往国会,向美国的最高立法者们演说,真正改变美国互联网行业以及社交平台运行的模式。

3 月,项目阶段性收尾,老师请组员(我和我的 MSCS 同学 Cassie)吃了饭。至此,我在 Stanford 的科研生活也就结束了。在这里,我在技术、团队合作等等方面,都学到了太多太多,一路走来,也对社会做出了一点属于自己的小小贡献。

c8f447c4d8c176595ab7e01bafc1476b.png
▲图:老师请我们吃饭的地方

最后,感谢大家的阅读:)

3b3f59b6ed3af2a0e2380d8cc7dec5a2.png萌屋作者:Jazon

来自南京,斯坦福MSCS(计算机硕士)在读,2022年6月毕业后在Google总部工作。爱安静地探索宇宙的奥秘,也爱和朋友桌游、运动。梦想养猫,花花与三猫的视频平均每个看过20+遍。相信AI虽然有趣,但短期内在美国职场生存,还是要靠丰富的开发技能。

作品推荐

  1. 人在斯坦福,刚上CS224n

  2. 谢撩,人在斯坦福打SoTA

6a0b23944ffb8b521563591ffb3d9e03.png后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

6bc43a48f386b7358e798092249f0df2.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477348.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剑指Offer - 面试题21. 调整数组顺序使奇数位于偶数前面(双指针,原地算法)

1. 题目 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分。 示例: 输入:nums [1,2,3,4] 输出:[1,3,2,4] 注:[3,1,2,4]…

使用Cloud Studio在线编写、调试和管理Spring Boot应用

在之前的《Spring Boot基础教程》中,我们介绍了通过Spring官方的构建页面来生成项目,也介绍了通过使用Intellij中的Spring Initializr来快速构建Spring Boot/Cloud工程。在完成了基础项目构建之后,我们要开始进行的就是代码的开发阶段&#x…

神TM的SOTA ,看完谷歌的新论文,我对AI大厂有些失望

源 | 机器之心用数万美元 TPU 算力,实现在 CIFAR-10 上 0.03% 的改进,创造了新的 SOTA,但这一切值得吗?「我相信他们得到的数字是准确的,他们确实做了工作并得到了结果…… 但这样真的好吗?」一名机器学习研…

Springboot 2.0选择HikariCP作为默认数据库连接池的五大理由

转载自公众号:工匠小猪猪的技术世界 摘要: 本文非原创,是笔者搜集了一些HikariCP相关的资料整理给大家的介绍,主要讲解了为什么sb2选择了HikariCP以及HikariCP为什么这么快。 Springboot2默认数据库连接池选择了HikariCP为何选择HikariCP理由…

剑指Offer - 面试题13. 机器人的运动范围(BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS2.2 DFS1. 题目 地上有一个m行n列的方格,从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动,它每次可以向左、右、上、下移动一格(不能移动到方格外),也不能进入…

聊聊“润(run)”

文 | One day知乎大家好,我是one day。前不久,我和知乎大V陈然老师在广州的台风天上午,线上聊了一杯咖啡时间的天,老师帮忙解答了一些疑虑,share了一些自己的想法。主要是围绕 美国湾区互联网工作氛围、大厂&创业公…

Spring Boot使用@Async实现异步调用:使用Future以及定义超时

之前连续写了几篇关于使用Async实现异步调用的内容,也得到不少童鞋的反馈,其中问题比较多的就是关于返回Future的使用方法以及对异步执行的超时控制,所以这篇就来一起讲讲这两个问题的处理。 如果您对于Async注解的使用还不了解的话&#xf…

《程序员面试金典》解题目录(更新完毕)

题目来源于LeetCode上的《程序员面试金典》,这里做一个目录方便大家查找。另外有本人的LeetCode解题目录、《剑指Offer》解题目录、LintCode代码能力测试CAT 解题目录可点击链接查看。updated on 2020.4.17 不懂的概念可以参考《数据结构与算法之美》学习汇总 已解…

我竟在一篇AI顶会论文里见到了小猪佩奇...

声明:本文原创首发于公众号夕小瑶的卖萌屋。作者:智商掉了一地--->【我是传送门】,内含海量CV/NLP/ML入门资料、必刷综述、前沿论文解读、交流社群、offer神器、学习神器等在介绍接下来的内容前,我们先来看一则笑话&#xff1a…

程序员面试金典 - 面试题 01.01. 判定字符是否唯一(位运算,牛)

1. 题目 实现一个算法&#xff0c;确定一个字符串 s 的所有字符是否全都不同。 示例 1&#xff1a; 输入: s "leetcode" 输出: false 示例 2&#xff1a; 输入: s "abc" 输出: true限制&#xff1a; 0 < len(s) < 100 如果你不使用额外的数据结构…

Spring Boot快速开发利器:Spring Boot CLI

Spring Boot CLI&#xff08;Command Line Interface&#xff09;是一个命令行工具&#xff0c;您可以用它来快速构建Spring原型应用。通过Spring Boot CLI&#xff0c;我们可以通过编写Groovy脚本来快速的构建出Spring Boot应用&#xff0c;并通过命令行的方式将其运行起来。下…

微软发现了一个超简单的NLP上分技巧,还发了ACL2022 ??

文 | QvQ编 | Sheryc_王苏今天给大家介绍一篇来自工业界巨头微软的工作&#xff0c;这篇论文真是把资本家的嘴脸暴露的一览无余&#xff1a;用最低的成本&#xff0c;创造最高的收益&#xff08;狗头.jpg&#xff09;文章从头到尾就阐述了一个结论&#xff1a;通过在输入文本中…

程序员面试金典 - 面试题 01.05. 一次编辑(编辑距离,DP)

1. 题目 字符串有三种编辑操作:插入一个字符、删除一个字符或者替换一个字符。 给定两个字符串&#xff0c;编写一个函数判定它们是否只需要一次(或者零次)编辑。 示例 1: 输入: first "pale" second "ple" 输出: True示例 2: 输入: first "pa…

Spring Boot使用@Async实现异步调用:ThreadPoolTaskScheduler线程池的优雅关闭

上周发了一篇关于Spring Boot中使用Async来实现异步任务和线程池控制的文章&#xff1a;《Spring Boot使用Async实现异步调用&#xff1a;自定义线程池》。由于最近身边也发现了不少异步任务没有正确处理而导致的不少问题&#xff0c;所以在本文就接前面内容&#xff0c;继续说…

MIT毕业生亲述:在Deepmind打工是一种什么样的体验?

文 | Akhil Raju源 | 机器之心在这里&#xff0c;既有头脑风暴&#xff0c;也有生活气息。本月初&#xff0c;时任苹果机器学习总监的 Ian Goodfellow 宣布在加入公司三年后辞职&#xff0c;没过几天&#xff0c;就有消息曝出大神去向定了&#xff0c;他将重返谷歌加入 DeepMin…

LeetCode 72. 编辑距离(DP)

1. 题目 给定两个单词 word1 和 word2&#xff0c;计算出将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作&#xff1a; 插入一个字符删除一个字符替换一个字符 示例 1: 输入: word1 "horse", word2 "ros" 输出: 3 解…

毕业后到底去学术界还是工业界?杜克大学陈怡然教授亲述5条“小秘籍”

文 | 卖萌酱大家好&#xff0c;我是卖萌酱。今天和大家聊一个非常受关心的话题&#xff1a;毕业到底是去学术界还是工业&#xff1f;刚好最近看到杜克大学陈怡然教授在微博上对此有亲身感悟&#xff1a;陈怡然教授认为回学校而不去公司有以下几个理由&#xff1a;1. 我不喜欢随…

程序员面试金典 - 面试题 17.11. 单词距离(multimap平衡二叉搜索树)

1. 题目 有个内含单词的超大文本文件&#xff0c;给定任意两个单词&#xff0c;找出在这个文件中这两个单词的最短距离(相隔单词数)。 如果寻找过程在这个文件中会重复多次&#xff0c;而每次寻找的单词不同&#xff0c;你能对此优化吗? 示例&#xff1a; 输入&#xff1a;w…

腾讯薪酬改革来了!晋升≠加薪?员工到底为何工作?

文 | 天于刀刀这届打工人真的是太太太难了&#xff01;朝九晚九地写PPT&#xff0c;熬KPI&#xff0c;疫情它来了&#xff1b;终于习惯了隔离核酸&#xff0c;走出EMO&#xff0c;隔壁工位的同学被毕业了&#xff1b;最终凭着玄学幸运留组&#xff0c;还没来得及准备庆祝一下六…

Spring Boot和Feign中使用Java 8时间日期API(LocalDate等)的序列化问题

LocalDate、LocalTime、LocalDateTime是Java 8开始提供的时间日期API&#xff0c;主要用来优化Java 8以前对于时间日期的处理操作。然而&#xff0c;我们在使用Spring Boot或使用Spring Cloud Feign的时候&#xff0c;往往会发现使用请求参数或返回结果中有LocalDate、LocalTim…