Jarvis:一个值得关注的多模态端到端人机对话框架,针对所有行业适配

说到应用级的人机对话框架,很多人可能首先想到的是RASA开源项目。不过,今天跟大家简要分享一个功能更为丰富、性能更为强劲的多模对话框架——Jarvis,非常值得对话系统从业者关注一下。

v2-689eb84d5d1909ef438fa26377b7185a_b.jpg

Jarvis是英伟达于2019年发布的人机对话服务,不同于大部分的开源项目,Jarvis主打的是深度对话模型的部署和推理效率,因此更具实用价值。有过对话系统开发经验的从业者知道,对话系统中离不开的语音识别(ASR)、对话理解等模块不仅难以开发,而且往往模型非常重,导致系统会产生明显的延时,导致实际应用中经常不得不用精度更弱但速度更快的方案取而代之。而基于Jarvis开发的对话系统,不仅支持了语音识别、对话理解等若干深度学习模型,而且实现了端到端的实时对话,可以将系统级的延迟降低到300ms以内,若是使用GPU部署,更是相比CPU部署可以再提高7倍的吞吐量。

此外,Jarvis框架内集成了若干重要的预训练对话模型和集成工具,以及若干经过英伟达深度优化的视觉、语音和NLU服务(services),使得开发者可以非常容易实现多用户、多上下文的复杂对话场景,进而开发虚拟对话助理、多用户说话人对话内容分离、智能外呼助手等实际应用。

这里贴了一张Jarvis内集成的技能图

v2-bccf5639b818a2a8b1a2ed92f6b7b0e1_b.jpg

可以看到Jarvis不仅支持了传统的语音识别、对话唤醒、对话理解、对话生成、语音生成等对话模块,而且还集成了手势识别、嘴唇活跃度检测、凝视检测、物体识别等视觉方面的技能,这些技能使得高效开发多模态对话应用真正成为了可能。

此外,虽然Jarvis做了大量精度、效率方面的优化,但是开发者实际使用起来却非常容易上手。如下图,只需要 4步 就能启动一个属于自己的对话服务了!

v2-37fd0dfcdfdb7b7a261bd75c152bc0b9_b.jpg

服务启动成功示例图:

v2-cf91d2434a4e738f42b17e62f6c68a99_b.jpg

服务启动完成后,我们就可以轻松的使用client端的API来向服务器请求对话服务了,仅需两行代码:

v2-15f8e9ca7b4989ed95b16308464ff375_b.jpg

详细搭建流程传送门:
developer.nvidia.com/nv

感兴趣的小伙伴快去试试吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478683.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

技术动态 | 知识图谱构建的研究已走入下半场,但大规模落地应用仍需时间

本文转载自公众号:AI前线。作者 | 李冬梅 采访嘉宾 | 唐杰知识图谱是近年来人工智能技术蓬勃发展的核心驱动力之一,已广泛应用在金融、电商、医疗、政务等众多领域,经过短短几年的发展,热度依旧不减,未来,知…

LeetCode 542. 01 矩阵(BFS DP)

文章目录1. 题目2. 解题2.1 BFS2.2 DP动态规划1. 题目 给定一个由 0 和 1 组成的矩阵,找出每个元素到最近的 0 的距离。 两个相邻元素间的距离为 1 。 示例 1: 输入: 0 0 0 0 1 0 0 0 0 输出: 0 0 0 0 1 0 0 0 0示例 2: 输入: 0 0 0 0 1 0 1 1 1 输出: 0 0 0 0…

美团旅行销售绩效系统研发实践

背景 O2O是目前互联网竞争最激烈的领域之一,其重要的业务特征是有大规模的线下业务团队,他们分布在五湖四海,直接服务着数以百万的商家,责任很重,管理的难度巨大。能否通过技术手段,打造高效的线下团队&…

业界大盘点!文本相关性在搜广推三大场景中的应用!

业界大盘点!文本相关性在搜广推三大场景中的应用!:https://mp.weixin.qq.com/s/kYou_ikuNPr4PsWbJpDKYw

深入解析Node.js setTimeout方法的执行过程

深入了解setTimeout源码之前,本有两个选择。一是通过chromium源码分析,二是通过Node.js源码分析。后来发现第一种方案的源码获取成本太大,于是从Node官网获取了几十兆的代码用来了解。 当前的Node版本为:v10.16.0 setTimeout方法定…

别只关注GPT3!细如发丝的模型更具现实杀伤力!

这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3;而另一种恰恰相反,是把很平常的东西做到最小。 ----王苏语录GPT3自从诞生以来,便受到…

论文浅尝 - EMNLP2020 | 基于分组式对比学习的神经对话生成

论文笔记整理:叶宏彬,浙江大学计算机博士生。论文地址:https://arxiv.org/abs/2009.07543摘要:近年来,神经对话问答的产生已广受欢迎。现有对话模型学习中广泛采用了最大似然估计目标(MLE)。但是…

LeetCode 841. 钥匙和房间(DFS/BFS)

文章目录1. 题目2. 解题2.1 DFS2.2 BFS1. 题目 有 N 个房间,开始时你位于 0 号房间。每个房间有不同的号码:0,1,2,…,N-1,并且房间里可能有一些钥匙能使你进入下一个房间。 在形式上&#xff…

容器中用uwsgi协议部署注意的问题以及用flask部署

1 表示当前容器名 一般通过 docker exec -it 容器名 /bin/bash , 进入容器内部进行操作,比如安装环境,传输文件 2 4888 容器内部访问端口地址,如果对外开放api,需要对其进行映射,比如映射成11022,11022是对外访问的端…

美团点评金融平台Web前端技术体系

背景 随着美团点评金融业务的高速发展,前端研发数量从 2015 年的 1 个人,扩张到了现在横跨北上两地 8 个事业部的将近 150 人。业务新,团队新,前端领域框架技术又层出不穷,各个业务的研发团队在技术选择上没有明确的指…

Promise源码解析

Promise源码解析 纸上得来终觉浅,绝知此事要躬行。之前只是很浅显的知道Promise的用法,也大概猜测到它的内部是如何实现的。但是总是有一种不深究一下就不踏实的感觉。于是从npm上获得早期的Promise源代码,拿过来读一读,做一做笔…

参会邀请 - CCKS2020 | 2020全国知识图谱与语义计算大会(CCKS2020)明日开幕

本文转载自公众号: 中国中文信息学会。第十四届全国知识图谱与语义计算大会将于2020年11月12日-15日在南昌召开。会议由中国中文信息学会语言与知识计算专业委员会主办,由江西师范大学承办,智源社区提供社区支持。本次会议讲习班采用线上举行…

Linux 程 序 员 失 业 警 告

文 | 小戏有多少人期待过像贾维斯一样的强人工智能?尽管老实说看当下的技术离这一期待还很遥远,但用用类似 GPT-3 这样的技术去实现些朴素的愿望似乎并没有那么困难。就在昨天,来自 Facebook 的 Elvis 在推特上发布了一个借助 OpenAI 的 GPT-…

LeetCode 707. 设计链表(List)

文章目录1. 设计一个单链表2. 双向链表1. 设计一个单链表 在链表类中实现这些功能: get(index):获取链表中第 index 个节点的值。如果索引无效,则返回-1。 addAtHead(val):在链表的第一个元素之前添加一个值为 val 的节点。插入…

用Vue.js开发微信小程序:开源框架mpvue解析

前言 mpvue 是一款使用 Vue.js 开发微信小程序的前端框架。使用此框架,开发者将得到完整的 Vue.js 开发体验,同时为 H5 和小程序提供了代码复用的能力。如果想将 H5 项目改造为小程序,或开发小程序后希望将其转换为 H5,mpvue 将是…

axios网络请求框架源码解析

早期axios0.1.0版本做了对IE浏览器与包含XmlHttpRequest的浏览器的支持。并且做了对请求参数拼接、Json对象序列化等基本功能。 到0.19.0版本时,内部请求已经变为了在Node环境下与主流浏览器的支持,其中Node环境下支持http请求与https请求。并且支持取消…

修改安装路径 pip 以及修改运行路径

持久化安装 如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例: !mkdir /home/aistudio/external-libraries !pip install beautifulsoup4 -t /home/aistudio/external-libraries同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可: import s…

对比学习有多火?文本聚类都被刷爆了…

文 | 花小花Posy大家好,我是小花。对比学习的大火???? 越来越旺了,已然从CV蔓延到NLP了。今天给大家介绍的正是一篇将对比学习应用到文本聚类上的工作,NAACL21新鲜出炉的paper——《Supporting Clustering with Contrastive Learning》。…

论文浅尝 - WWW2020 | 生成多跳推理问题以改善机器阅读理解能力

论文笔记整理:谭亦鸣,东南大学博士生。来源:WWW 2020链接:https://dl.acm.org/doi/pdf/10.1145/3366423.3380114概述这篇论文关注的任务是:基于给定文本的“多跳问题生成”(多关系问题)。作者提…

记一次Vue框架升级

框架升级背景 公司目前业务迭代很快,且大部分的流量都在公众号上。然而我们公众号所使用的框架却是3年前的Vue 1.0.16。面对Vue这3年来带来的无数新特性,我们只能望洋兴叹:看得见,摸不着,因为升级这事看起来太难了。 …