一场AI技术引发的金融业“降本增效”

c5dd160854972a4a94b9b30335ab58c7.jpeg

文 | 卖萌酱

大家好,我是卖萌酱。

“全面赋能千行百业”是AI的重要使命,政务、法律、金融、医疗、制造等传统行业往往智能化程度低,在效率、成本和收益方面蕴藏着巨大的优化空间。其中,金融业,就正在AI技术的赋能下,发生着一场“降本增效”的变革。本文详细聊聊这个话题。

我们分别从“场景”、“技术”和“工具”层面进行展开。

c5d6776ccf6d2d9e85e723db43acf2cc.png场景672dd58d7875778ece39a8ee398bb528.png

场景层面,提到AI+金融,可能会有人很快想到“股价预测”,但其实比起令人琢磨不透的股价波动,金融行业存在着更多收益确定性高、AI价值附增显著的业务场景。举几个例子:

  • 基于CV技术实现“印章弯曲文本检测与识别”;

  • 基于NLP技术实现的“上市公司公告风险事件提取”、“保险领域智能问答系统”;

  • 基于跨模态技术实现的“扫描版合同关键信息抽取”、“表格识别与属性分析”、“双录稽查场景智能音视频质检”;

  • 基于CV检测技术、智能推荐技术实现“银行网点来客画像分析与精准营销”等。

可以说,AI正在深入到金融行业的方方面面,酝酿一场巨大的“降本增效乃至增收”的行业变革。

6abb42c78f479a43f135c3ed041ec31f.png技术0cecc20093a6c823a5bbfefceeea8199.png

深耕技术深度和先进性常常能在互联网行业产生可观的收益,同样的,只要方向对,先进的AI技术用在传统行业的场景里同样能起到事半功倍的效果。

以金融保险领域客服业务场景为例,客服系统对客服人员有一定的专业性要求,导致企业人工成本高;实际场景中,用户常见的问题占了60%~70%,这部分人工重复性工作费时费力,因此,众多金融企业搭建了智能FAQ问答系统。常见的方案有诸多不足:

  • 一种方式基于保险关键字的问答匹配,该方法效果有限,无法对语义信息进行精准建模,且优化起来较为繁琐;

  • 基于语义匹配搭建问答系统,是越来越常见的做法,然而往往需要人工、半人工方式构造FAQ的“标准问”与“非标准问”,标注成本高,而且经常难以招架真实用户千变万化的表达方式,导致“人工智能”被用户吐槽成“人工智障”,可谓费力不讨好。

而百度研发了先进的端到端智能问答技术RocketQA,不仅在学术竞赛榜单MS MARCO多次刷新记录,而且实现了精准、泛化能力强的语义召回,在实际应用中大大减少了传统离散检索引入的人工构建开销。

66ba3bb118599d1f6ffb34977ffff7b9.png

RocketQA训练技术,可以借助cross-encoder精排模型的优势,有效地为语义召回模型挖掘困难样本,进而提升系统的语义召回能力;优化后的语义召回模型又进一步的提升了召回样本的质量,有助于后续打造效果更强的cross-encoder模型,提升模型的精排能力和最终的答案准确度。再结合人工标注的百万级问答数据集DuReader,效果非常强悍!

5466aa5ad9989631c6899fe06a822130.png

总之,基于端到端智能问答技术RocketQA构建出的FAQ问答系统,不仅构建效率大大提升,且无需标注数据、比传统技术方案具备显著的效果优势。

更进一步的 ,卖萌酱还使用了百度今年发布的集可信分析和增强于一体的可信AI工具集-TrustAI,问答效果有进一步提升。对NLP领域数据标注的常见问题,如“训练数据中存在脏数据限制模型效果提升”,“数据标注成本太高但又不清楚该标注什么数据”,“数据分布有偏导致模型鲁棒性差”等,TrustAI发布了多项功能帮助NLP开发者解决训练数据缺陷问题,用最小的标注成本获得最大幅度的效果提升。

以上技术均已开源。对智能问答技术赋能金融行业智能客服感兴趣的同学,可以关注9月27日的直播,扫码填写基本需求信息即可报名。

89cb46795291fb93390834a1d82f7ce5.jpeg

课程来源于百度飞桨&百度智能云举办的一个AI+金融行业系列直播(文末附系列课整体海报),从中可以看到AI在金融行业的风控、运维、营销、客服等场景都有大量的介入空间。

然而,如果徒有先进的AI技术,却没有配套的高效落地工具,那传统行业的落地依然困难重重,工具的重要性不言而喻。

624c90240610392924024a7cbec1ff3d.png工具76aabcb5a2f78e5d5c29d1835f1a23af.png

“深度学习,NLP啥的太难懂了,我们一时半会搞不定” ——来自行业人员吐槽

“需求场景太多了,人手不够,开发不过来” ——来自AI专业人员吐槽

这是AI在传统行业落地时经常在行业侧和互联网AI平台侧遭遇的灵魂抱怨。

究其原因,就在于大部分的AI落地工具是面向专业AI从业者开发的,对行业落地来说门槛过高或开发效率过低。而市面上的一些门槛低的AI平台又往往会牺牲灵活性,开发时会有较多的限制。

不过,百度飞桨PaddleNLP不久前发布了NLP流水线系统 Pipelines,卖萌酱试用后发现其在易用性、灵活性和定制化方面做了一个很好的折中,是一个非常适合做行业落地的开源工具。

cffeb5267388a610dedb9f49d944c42b.jpeg

简单来说,PaddleNLP Pipelines 将各个NLP复杂系统的通用模块抽象封装为标准组件,支持开发者通过配置文件对标准组件进行组合,仅需几分钟即可定制化构建智能系统,让解决NLP任务像搭积木一样便捷、灵活、高效。同时,Pipelines中预置了前沿的预训练模型和算法,在研发效率、模型效果和性能方面提供多重保障。

举个直观的例子。

我们可以把语义检索系统抽象为文档解析、语义向量抽取、向量存储、召回、排序5个基础组件,在此基础上,只需串接1个答案定位模型组件即可构成阅读理解式问答系统。若更进一步,在问答流水线的起点和终点分别加入 ASR(语音转换文本)和 TTS(文本转换语音)2个模型组件甚至可以构成智能语音客服系统,如下图所示。

1d49e81a751e0e207e1107f87d7679d1.gif

而Pipelines就实现了上图一样轻松灵活的开发模式,可将AI模型的上线周期缩短百倍以上。

需要注意的是,在 Pipelines 背后,不仅有 PaddleNLP 提供的强大模型生态(包括刷新中文小模型 SOTA 的文心 ERNIE 3.0轻量级模型),而且该框架兼容了飞桨生态下的任意模型、AI开放平台算子、其它开源项目如 Elasticsearch 等,从而实现任意复杂系统的灵活定制开发。

可以说,Pipelines在灵活易用的基础理念下,又给用户预留了足够的定制化空间,使得用户在面对奇奇怪怪的业务场景疑难问题时,不至于被平台功能给限制。

因此,在Pipelines的生产力赋能下,快速开发一个高精度的金融智能客服FAQ智能问答系统就非常容易了。

4abadf0fd17a1e271bdee28c2c9cab54.gif

同样的方式,我们可以面向金融行业快速开发一个信息抽取模型,来快速落地文首提到的“上市公司公告风险事件提取”、“合同关键信息抽取”等金融业务场景。在信息抽取方面,Pipelines则内置了百度的UIE通用信息抽取技术,其通过多任务统一建模大幅降低了模型开发成本和部署的机器成本,并具备突出的小样本学习能力。例如,在金融领域的事件抽取任务上,仅仅标注5条样本,F1 值就提升了25个点!

7c00c41067f231957eac0b8fc43bf35d.png

也就是说,基于Pipelines开发强大的业务模型并不需要用户有非常丰厚的AI优化经验,Pipelines已经为各大技术场景预置了先进的模型和开发范式,做到了“上手即SOTA”的开发体验,并提供强大的二次开发能力。

总之,PaddleNLP Pipelines不仅大幅提升了行业AI模型的开发和上线效率,大大降低了AI的落地门槛,且内置了当下前沿的NLP技术和模型,兼具易用性、灵活性和专业性,无论是专业的AI从业人员还是行业开发人员,均能快速驾驭,可以称之为NLP技术落地传统行业的开发神器。

PaddleNLP 项目地址:
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/pipelines/examples/FAQ
RocketQA 项目地址:
https://github.com/PaddlePaddle/rocketqa
TrustAI 项目地址:  
https://github.com/PaddlePaddle/TrustAI

最后,百度飞桨&智能云发起的智慧金融直播正在进行中!感兴趣的小伙伴,不要错过哦。 

传送门(如果已经在前面扫码,则报名成功,无需重复扫码):

96ef2a1b2c6d282045abcf21828783c3.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476886.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 999. 车的可用捕获量

1. 题目 在一个 8 x 8 的棋盘上,有一个白色车(rook)。也可能有空方块,白色的象(bishop)和黑色的卒(pawn)。它们分别以字符 “R”,“.”,“B” 和 “p” 给出…

matlab 转换为正整数_【MATLAB】专题1笔记 MATLAB基础知识

视频课程参考:https://www.bilibili.com/video/BV19J411W7Ta数值问题-->求解算法-->程序实现-->结果分析MATLAB 功能 :数值计算,符号计算,图形绘制,程序流程绘制,工具箱数值计算方法&#xff1a…

showModalDialog和showModelessDialog使用心得

一、showModalDialog和showModelessDialog有什么不同?  showModalDialog:被打开后就会始终保持输入焦点。除非对话框被关闭,否则用户无法切换到主窗口。类似alert的运行效果。  showModelessDialog:被打开后,用户可…

python网络编程内容_Python网络编程

本文要写的内容也称为Python套接字编程,并简单介绍socketserver类。参考教程主要是《Python核心编程》。 首先,客户端/服务器模型,客户端向服务器发送请求,在请求合理的情况下,服务器返回客户端需要的资源,…

程序员面试金典 - 面试题 16.17. 连续数列(DP/分治)

1. 题目 给定一个整数数组(有正数有负数),找出总和最大的连续数列,并返回总和。 示例: 输入: [-2,1,-3,4,-1,2,1,-5,4] 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大&#xff0c…

视觉能力提升112%!李飞飞团队让AI进入社会,学会了“骗”标注…

作者 | 李梅编辑 | 陈彩娴来源 | AI科技评论人类从与他人的互动中学习,而目前的人工智能却常常只能在与社会隔离的环境中学习。所以当我们把一个智能体放到真实世界中时,它会不可避免地在遇到大量新的数据,无法应对不断变化的新需求。如何将智…

.Net 1.1下WEB引用Win控件的两个Bug

1.WEB系统引用windows控件的方式来实现页面打印的功能,一直使用比较正常,有一天更新后部分机器不能正常加载控件。后来分析的N久,发现是打印控件上我加了一个Label,使用了Arial Black字体,如果客户的机器上没有这种字体…

程序员面试金典 - 面试题 16.11. 跳水板(数学)

1. 题目 你正在使用一堆木板建造跳水板。 有两种类型的木板,其中长度较短的木板长度为shorter,长度较长的木板长度为longer。 你必须正好使用 k 块木板。编写一个方法,生成跳水板所有可能的长度。 返回的长度需要从小到大排列。 示例&…

信息抽取终于实现了大一统~

2022年了,有人说信息抽取领域早已是诸神黄昏。然而即使这样,依然“内卷”不止。似乎这个卷成麻花的领域已经看不到希望?但是不久前,这个沉寂之地忽然翻起了浪花,一篇发表在ACL2022上的工作,昭示着这个领域终…

python的输出函数_Python

Python print() 函数 描述 print() 方法用于打印输出,最常见的一个函数。 在 Python3.3 版增加了 flush 关键字参数。 print 在 Python3.x 是一个函数,但在 Python2.x 版本不是一个函数,只是一个关键字。 语法 以下是 print() 方法的语法: pr…

ubuntu6.06容易死机的一种解决方法

修改 /etc/X11/xorg.conf 在 Section "Module" 中把下面这句话注视掉。 # Load "dri" 然后,在下面这个Section中(你的可能有些出入,但应该有个相似的Section),把 Driver "ati" 改成 Dri…

程序员面试金典 - 面试题 17.12. BiNode(BST中序遍历)

1. 题目 二叉树数据结构TreeNode可用来表示单向链表(其中left置空,right为下一个链表节点)。 实现一个方法,把二叉搜索树转换为单向链表,要求值的顺序保持不变,转换操作应是原址的,也就是在原始…

从大一统视角理解扩散模型(Diffusion Models)

文 | 中森知乎资料来源这篇文章是近期笔者阅读扩散模型的一些技术博客和概览的一篇梳理。主要参考的内容来自Calvin luo的论文,针对的对象主要是对扩散模型已经有一些基础了解的读者。Calvin luo 的这篇论文为理解扩散模型提供了一个统一的视角,尤其是其…

python开三次方_用python计算三次方根

我试图在python中计算以下函数:f(x) (1 cos(x))^(1/3) def eval( i ): return math.pow( (1 math.cos( i )), 1/3) 为什么它总是返回给我1? 我试图计算积分的Right和Left近似值,后者应用Simpsons Rule,但是Python似乎不喜欢这个…

程序员面试金典 - 面试题 16.05. 阶乘尾数(5的因子)

1. 题目 设计一个算法,算出 n 阶乘有多少个尾随零。 示例 1: 输入: 3 输出: 0 解释: 3! 6, 尾数中没有零。示例 2: 输入: 5 输出: 1 解释: 5! 120, 尾数中有 1 个零. 说明: 你算法的时间复杂度应为 O(log n) 。来源:力扣(LeetCode&#x…

XML动态排序(1)

<?xml version"1.0" encoding"gb2312" ?><?xml-stylesheet type"text/xsl" href"paixu.xsl" ?><BlueIdea><team><blue_ID>1</blue_ID><blue_name>Sailflying</blue_name><blu…

python绘画_python学画画(上)

下载W3Cschool手机App&#xff0c;0基础随时随地学编程 导语 本来想用神经网络让计算机学会画铅笔画和素描的&#xff0c;后来发现其实不用神经网络效果也还可以&#xff0c;那么系列上就从简单的入手&#xff01; 先放图哈&#xff01;沙画&#xff1a;铅笔画&#xff1a;文件…

抖音、Tiktok危机!谷歌AI短视频生成模型,效果惊艳了

文 | 梦晨 Pine(发自凹非寺)源 | 量子位内容生成AI进入视频时代&#xff01;Meta发布「用嘴做视频」仅一周&#xff0c;谷歌CEO劈柴哥接连派出两名选手上场竞争。第一位Imagen Video与Meta的Make-A-Video相比突出一个高清&#xff0c;能生成1280*768分辨率、每秒24帧的视频片段…

程序员面试金典 - 面试题 16.07. 最大数值(位运算求max)

1. 题目 编写一个方法&#xff0c;找出两个数字a和b中最大的那一个。不得使用if-else或其他比较运算符。 示例&#xff1a; 输入&#xff1a; a 1, b 2 输出&#xff1a; 22. 解题 有符号整型数的二进制最高位存储的是符号位将符号位获取&#xff0c;1为负数&#xff0c;0…

python生成json_Python 生成json文件

原博文 2018-04-12 17:00 − 1.数据准备 数据下载 2.python代码 import datetime import os import mssqlhelper ms mssqlhelper.MSSQL(host"192.168.0.108", user"sa", pwd...218659 相关推荐 2019-05-09 21:36 − JSON(JavaScript Object Notation, JS …