码农创造了AI,但开发AI不再需要码农了??

马上就要到一年一度的618大促,卖萌酱在添加购物车时,选择困难症又犯了。

如今的电商评论区,大量刷单行为淹没了重要的产品评价,有的被淹没在了追评区,有的平台甚至已经不分好评/中评/差评区了,而是“一眼望去好评如潮”。

e0c8d7c4edee3cdfd9c32098c4ee49af.png

比如某净水器的评论区,看似只有200条差评,但1.3w条追评、10w条好评中其实隐藏着数不清的差评,这些差评往往可信度极高(毕竟卖家和同行都不会雇水军去好评区写差评)

但如果想从追评和好评区找出这些差评,能找到你眼瞎。

于是卖萌酱心生一计,既然评论数量这么多,为啥不自己训练个AI模型来从动辄10万+评论的评论区里自动挖掘差评呢?

毕竟人眼一秒看不了10条评论,但AI模型一秒看100条甚至1000条评论也不成问题(只要你有好显卡部署服务)。

说!干!就!干!

ee5159ce24ac1f5066c66046882dbf31.png

首先卖萌酱将这个“找差评”的问题抽象成NLP中的“情感极性分类”问题,进而我们的任务就变成了四步:

富集评论情感极性分类数据集 —> 训练调优情感分类模型 —> 部署模型得到API —> 调用API解决问题

富集评论情感极性数据还好说,中文社区有不少公开数据集。但AI模型的训练和部署就麻烦多了。如果基于传统的深度学习框架从头折腾,无论代码量还是调试调优成本都不低。

这对于只想快速实现情感挖掘功能的我来说无疑效率太低了。

这时大佬给卖萌酱推荐了一个高效低成本的平台——EasyDL,不到一天就能完成从数据集到部署API。

半信半疑的卖萌酱开始了试用之路…


打开EasyDL官网后,首先要选择你要做什么任务:

e5a1b34826f63e457c90f50a9a9e6dba.png

好家伙,我开始以为是个high-level深度学习框架,看到上图才意识到原来这是个更上层的AI应用开发平台,涵盖了图像、文本、语音、视频、结构化数据等各种任务场景和数据场景。

这里我们关注的是里面的EasyDL-文本任务。针对本次的任务目标,我们可以选择文本分类-单标签,但卖萌酱发现还有更加具体的“情感倾向分析”任务,于是直接选择了后者(上图红框部分)。

完成任务选择后,平台给到了开发任务的流程提示:


5fbbfc8f7541c36aa88bf5ff7a4453a7.png

这个流程对于一个久经沙场的算法工程师来说已经非常熟悉了,于是卖萌酱跳过指导,开始了开发。

随着开发的进行,卖萌酱慢慢发现不对劲了。

5b8dddc8128ab9387dc4cef5f55e0d64.png

数据载入处理完了,我没写代码?

53a9adce05b1b2adf21e4eb08a7431c1.png

模型训练&效果调优完了,我依然没写代码?

8301339851935774624204dbefb1917d.png

部署完成,服务的远端API我也拿到了,我最终一行代码都没写??

甚至,就连调用API的client端脚本,平台都给出来了,也不用自己写。。

卖萌酱进而将某商品评论区爬下来的数万条评论存到文件comments.txt中,调用我们已经部署完成的API来挖掘负面评论:

2f0e6e4b29cacf5134c7f0ee663e00c2.png

负面评论被源源不断的挖掘出来了!

最后发现某净水器商品的差评区尽管只有200条差评,但通过我们的脚本过全部的数万条评论,却挖掘出来了3300多条差评

此时卖萌酱陷入了深深的思考——

“做了这么多年的AI算法工程师,到头来,却发现AI的训练和部署已经不需要写代码了?”

虽然码农创造了AI技术,但从技术应用的角度,开发AI已经越来越不需要码农了…

1815a7b53102dcc8691610f05d2c58d5.png

需要注意的是,卖萌酱全程没有任何人指导,甚至也没看官方的指导手册,此前也从未用过EasyDL。初次跑通以上全流程,卖萌酱只用了3小时,而且其中还包括了1个多小时的模型训练与自动调优的时间。

放在以前,3小时对AI算法工程师来说能做什么?

从0开始一个任务的话,3小时,大概模型训练代码还没写完吧。。。

在初次听说EasyDL之前,卖萌酱以为这只是个API封装怪,但真正试用下来,却发现这是个颠覆性的AI开发平台。

本着把3天开发时间降低到1天的心态试用,结果没想到3小时就解决了,而且没有写一行代码。EasyDL的易用性和使用门槛,就连非专业的算法工程师,也绝对可以应付的来了。

577773c5c645d5ccac9139ca118e6889.png

想体验零代码NLP开发全流程的小伙伴们,EasyDL官方会于6月9号晚20点组织一场直播,传送门:

paddleqiyeban.wjx.cn/vm

戳完报名后,记得定好闹钟!届时会有诸多学习干货、实战体验和大礼包相送哦~

另外,卖萌酱还有一点不解,从最终的负面评论挖掘效果来看,是非常精准、惊艳的。但是卖萌酱却只丢了1万条标注样本给平台,是什么撑起来了模型效果呢?

卖萌酱在配置模型训练环节时,注意到了EasyDL平台有这么一个选项:

7e3f16e75b121a0cd179dc1a22ef82fa.png

意思是说,如果训练阶段是选择了高精度,那就会调用文心大模型作为backbone并完成参数热启。

关注NLP预训练进展的小伙伴对文心大模型“ERNIE”一定不陌生了。

2019年12月,ERNIE 2.0登顶GLUE:

0e7f324b628a441ea7f17d4318fd47ea.png

2021年7月,百亿参数规模的ERNIE 3.0霸榜SuperGLUE:

1fde26bec449b9bd4079b66a3501d6f0.png

在中文任务上,ERNIE 3.0更是实现了全面屠榜:

dab324d67c0583687af17418687a1b25.png

而在EasyDL·文本任务中就内置了包含ERNIE 3.0在内的30+预训练大模型,除了通用大模型外,还包括了抽取、匹配等专属任务模型和金融、法律、医疗等领域模型。正是文心大模型的赋能,EasyDL·文本才得以在实现极简易用性的同时,做到超高精度的模型产出。

毫不夸张的说,这个写了0行代码、花了3个小时部署得到的评论极性判别的API,可能比许多专业的算法工程师折腾数天搞出来的API都好用。

至此,作为一个AI算法工程师,卖萌酱深深的感慨:

我们开发了AI,但AI开发可能不再需要我们了。

最后,想体验零代码NLP开发全流程的小伙伴们,EasyDL官方会于6月9号晚20点组织一场直播,传送门:

paddleqiyeban.wjx.cn/vm

戳完报名后,记得定好闹钟!届时会有诸多学习干货、实战体验和大礼包相送哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477300.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1351. 统计有序矩阵中的负数

1. 题目 给你一个 m * n 的矩阵 grid,矩阵中的元素无论是按行还是按列,都以非递增顺序排列。 请你统计并返回 grid 中 负数 的数目。 示例 1: 输入:grid [[4,3,2,-1],[3,2,1,-1],[1,1,-1,-2],[-1,-1,-2,-3]] 输出:…

码农创造了AI,但开发AI不再需要码农了

马上就要到一年一度的618大促,卖萌酱在添加购物车时,选择困难症又犯了。 如今的电商评论区,大量刷单行为淹没了重要的产品评价,有的被淹没在了追评区,有的平台甚至已经不分好评/中评/差评区了,而是“一眼望…

JPA的多表复杂查询

最近工作中由于要求只能用hibernatejpa 与数据库进行交互&#xff0c;在简单查询中&#xff0c;jpa继承CrudRepository<T, ID>接口 &#xff0c;然后利用jpa的方法命名规范进行jpql查询&#xff0c;然而在进行复杂查询时&#xff0c;需要继承JpaSpecificationExecutor接口…

LeetCode 1352. 最后 K 个数的乘积

1. 题目 请你实现一个「数字乘积类」ProductOfNumbers&#xff0c;要求支持下述两种方法&#xff1a; add(int num) – 将数字 num 添加到当前数字列表的最后面。getProduct(int k) – 返回当前数字列表中&#xff0c;最后 k 个数字的乘积。 – 你可以假设当前列表中始终 至少…

颠覆认知!数据增强、正则化可导致不易察觉的灾难?

文 | 子龙编 | 智商掉了一地作为常用的炼丹技巧&#xff0c;正则化 (Regularization) 和数据增强 (Data Augmentation, DA) 常常被简单粗暴地引入模型中来防止数据过拟合&#xff0c;进而提升最后的 performance。如果说&#xff0c;更高的performance就意味着更好的泛化能力&a…

spring-boot-starter-swagger 1.3.0.RELEASE:新增对JSR-303的支持和host的配置

简介 该项目主要利用Spring Boot的自动化配置特性来实现快速的将swagger2引入spring boot应用来生成API文档&#xff0c;简化原生使用swagger2的整合代码。 源码地址 GitHub&#xff1a;https://github.com/dyc87112/spring-boot-starter-swagger码云&#xff1a;https://git…

LeetCode 1353. 最多可以参加的会议数目(排序+贪心,优先队列,难)

文章目录1. 题目2. 解题2.1 错误解2.2 超时解2.3 通过解2.4 大佬解1. 题目 给你一个数组 events&#xff0c;其中 events[i] [startDayi, endDayi] &#xff0c;表示会议 i 开始于 startDayi &#xff0c;结束于 endDayi 。 你可以在满足 startDayi < d < endDayi 中的…

深圳率先立法:支持L3自动驾驶上路,凡公开道路皆可行

文 | 万博 发自 副驾寺源 | 智能车参考全国第一个开放L3级自动驾驶的城市&#xff0c;就要来了。不是自动驾驶第一城的广州&#xff0c;也不是拥有全球首个高级别自动驾驶示范区的北京&#xff0c;最先吃螃蟹的&#xff0c;是深圳。根据深圳人大常委会发布的2022年立法计划&…

在Pivotal Web Service上发布Spring Boot应用

Hello PWS&#xff08;Pivotal Web Service&#xff09;&#xff0c;由 Pivotal 公司提供的 &#xff0c;可以运行Java, Grails, Play, Spring, Node.js, Ruby on Rails, Sinatra or Go 等Web应用的服务。本文将介绍一个 Hello World 级别的 Spring Boot 应用发布到 PWS 的过程…

CVPR 2022 | FAIR提出MaskFeat:自监督视觉预训练新方法!灵感之一来自16年前CVPR论文...

编 | 小咸鱼 好困源 | 新智元【导读】近日&#xff0c;北大校友、约翰霍普金斯大学博士生提出了一种新的方法&#xff1a;MaskFeat&#xff0c;摘下12个SOTA&#xff01;这是一个能用于视频模型的自监督预训练方法&#xff1a;掩码特征预测&#xff08;MaskFeat&#xff09;。论…

简化Swagger使用的自制Starter:spring-boot-starter-swagger,欢迎使用和吐槽

项目简介 该项目主要利用Spring Boot的自动化配置特性来实现快速的将swagger2引入spring boot应用来生成API文档&#xff0c;简化原生使用swagger2的整合代码。 GitHub&#xff1a;https://github.com/dyc87112/spring-boot-starter-swagger码云&#xff1a;http://git.oschi…

LeetCode 1354. 多次求和构造目标数组(优先队列+逆向思考)

1. 题目 给你一个整数数组 target 。一开始&#xff0c;你有一个数组 A &#xff0c;它的所有元素均为 1 &#xff0c;你可以执行以下操作&#xff1a; 令 x 为你数组里所有元素的和选择满足 0 < i < target.size 的任意下标 i &#xff0c;并让 A 数组里下标为 i 处的…

Spring Boot自动化配置的利弊及解决之道

Spring Boot中的双刃剑&#xff1a;自动化配置 在之前发布的Spring Boot基础教程系列文章中&#xff0c;我们通过各种功能性示例体验了Spring Boot的自动化配置给我们所带来的超便利的新开发方式。但是&#xff0c;在一些情况下Spring Boot的自动化配置也会给我们惹来不少的麻…

人在ACL2022,无人戴口罩我有些慌

文 | 小伟大家好&#xff0c;我是阿伟 (不是杰哥不要的阿伟)&#xff0c;NLP小萌新&#xff0c;好久不见&#xff01;之前忙着赶ddl一直没时间写文&#xff0c;趁着这次去都柏林参加了人生第一次线下ACL会议的机会&#xff0c;把自己的一些体验分享给大家。22号早上到了都柏林发…

剑指Offer - 面试题32 - I. 从上到下打印二叉树(按层BFS遍历,queue)

1. 题目 从上到下打印出二叉树的每个节点&#xff0c;同一层的节点按照从左到右的顺序打印。 例如: 给定二叉树: [3,9,20,null,null,15,7],3/ \9 20/ \15 7 返回&#xff1a; [3,9,20,15,7]提示&#xff1a; 节点总数 < 1000来源&#xff1a;力扣&#xff08;LeetCode…

Spring Boot中使用Actuator的/info端点输出Git版本信息

对于Spring Boot的Actuator模块相信大家已经不陌生了&#xff0c;尤其对于其中的/health、/metrics等强大端点已经不陌生&#xff08;如您还不了解Actuator模块&#xff0c;建议先阅读《Spring Boot Actuator监控端点小结》&#xff09;。但是&#xff0c;其中还有一个比较特殊…

管培生走下神坛,“高管捷径”破灭

文 | 翟元元源 | Tech星球曾经令打工人羡慕不已的管培生光环&#xff0c;正逐渐失色。近日&#xff0c;一位叮咚买菜的管培生在某社交平台爆料&#xff0c;管培生这一带有职业光环的角色有着不为人知的B面。“叮咚买菜管培生&#xff0c;别去&#xff0c;快跑。每天12小时以上体…

剑指Offer - 面试题32 - III. 从上到下打印二叉树 III(BFS,queue+stack)

1. 题目 请实现一个函数按照之字形顺序打印二叉树&#xff0c; 即第一行按照从左到右的顺序打印&#xff0c; 第二层按照从右到左的顺序打印&#xff0c; 第三行再按照从左到右的顺序打印&#xff0c;其他行以此类推。 例如: 给定二叉树: [3,9,20,null,null,15,7],3/ \9 20/…

互联网行业,回暖了?

源 | 36氪经过这一年的调整&#xff0c;中国互联网企业或许才算得上真正成熟起来。有统计显示&#xff0c;目前中国互联网公司股价已经缓慢升至 3 个月以来的新高。反映中概股表现的纳斯达克中国金龙指数在近期连涨三天&#xff0c;自5月11日以来更是累计上涨逾40%。利好的信号…

使用Spring Boot Actuator、Jolokia和Grafana实现准实时监控

由于最近在做监控方面的工作&#xff0c;因此也读了不少相关的经验分享。其中有这样一篇文章总结了一些基于Spring Boot的监控方案&#xff0c;因此翻译了一下&#xff0c;希望可以对大家有所帮助。 原文&#xff1a;Near real-time monitoring charts with Spring Boot Actuat…