“我要做小小瑶大人的狗!”

16b36ac69e52051c11e9992f077e54fd.png

小轶:这真的是白鹡鸰写的

作为21世纪新时代人格健全精神独立心理健康的有志青年,总有那么几个时刻,会让我们情不自禁,眼泪从嘴角流下地呐喊着:

“我是XXX的狗!”

啊!这诚恳、真挚,热烈的情感真是令人动容!如此质朴的愿望,纯洁的心意,怎么能只是口头说说,而不进行实践呢?四肢着地匍匐前进确实不太符合人类的身体构造,但是狗叫呢?狗叫还是很容易的吧?

我们善解人意的岛国邻居,充分理解了羞涩内敛的大家,迫于矜持无法拉下面子狂吠的心理,于是,由日本学术振兴会赞助,立命馆大学隆重推出了“我不做人了!”任务第一弹:人狗语音转换!如何?惊不惊喜?意不意外?

c35f3e7dfe793d01c4ab53f731137c29.png

论文题目:
Speak Like a Dog: Human to Non-human creature Voice Conversion

论文链接:
https://arxiv.org/abs/2206.04780

在看到这个任务的第一眼,我还试图用凡人的思路去揣测它的逻辑,还认真思考了一下目前动物语言学的发展程度。难道研究者已经完全理解了狗的语言,发现了它们真的有如此丰富的词汇,并且能够将人类的语言与之一一对应地翻译了?为什么人类的语言之间都还没有做到的事情,却能在人狗之间实现?怀揣着对黑科技的憧憬,我打开了论文。

对不起,是我唐突了。这是一个纯粹而高尚的变声任务。

6888c45ab7cad14e03575138b5e3ed3e.png

任务的输入是人声音频,输出是合成的狗叫音频。数据音源中,包含503段人类的声音,自收集了成年犬792段和幼崽288段叫声。论文采用音频合成领域经典的StarGAN和ACVAE作为benchmark,并设计了三个主观定性指标:输出音频和狗叫声的相似度,音频质量,声音清晰度;还有一个量化指标,角色偏差程度用于评估模型的效果。目前为止,benchmark在测试中遥遥领先。

cca7ada3cbadbd14091f8c44f6c919fa.png

有没有可能,这是诡计多端的科研人员的新式诈骗经费方法?不,绝不可能!请不要以如此肤浅的想法来揣测这篇论文的作者们!他们雄心壮志,要建立“我不做人了!”系列任务的发布范式。你看,新鲜的数据集,完整的评估体系,健全的benchmark,这已经达成了一个新研究挑战的必备条件了啊!只要沿着这个模版一路走下去,未来Speak like a cat,Speak like a jellyfish等任务就可以层出不穷,绵延不绝了!来吧,前方是一片尚未开拓,广袤的研究空间,不要担心任务的意义和有效性,现在入坑,十年之后,你就是“我不做人了!”研究领域的学术泰斗!

今天就叫到这里,关于论文任务的详细信息,欢迎大家查阅原文,不过只有5页哦!请诸位且看且珍惜~

ab92f25489c53a0d0633b457a7abe0a1.png后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

ed7680835b7990af83768b09dae738da.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477249.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot中的缓存支持(一)注解配置与EhCache使用

随着时间的积累,应用的使用用户不断增加,数据规模也越来越大,往往数据库查询操作会成为影响用户使用体验的瓶颈,此时使用缓存往往是解决这一问题非常好的手段之一。Spring 3开始提供了强大的基于注解的缓存支持,可以通…

LeetCode 1361. 验证二叉树(图的出入度)

1. 题目 二叉树上有 n 个节点,按从 0 到 n-1 编号,其中节点 i 的两个子节点分别是 leftChild[i] 和 rightChild[i]。 只有 所有 节点能够形成且 只 形成 一颗 有效的二叉树时,返回 true;否则返回 false。 如果节点 i 没有左子节…

微软:我已把显存优化做到了极致,还有谁?

文 | 王思若大家好,我是王思若。17年6月Google提出了Transformer架构,这篇目前Citation 4.3万的文章开启了大规模预训练模型时代。或者,更精确的从18年OpenAI和Google分别基于其中的Decoder和Encoder发布的大规模预训练模型GPT1和BERT开始&am…

Spring Boot中使用JavaMailSender发送邮件

相信使用过Spring的众多开发者都知道Spring提供了非常好用的JavaMailSender接口实现邮件发送。在Spring Boot的Starter模块中也为此提供了自动化配置。下面通过实例看看如何在Spring Boot中使用JavaMailSender发送邮件。 快速入门 在Spring Boot的工程中的pom.xml中引入sprin…

LeetCode 1362. 最接近的因数

1. 题目 给你一个整数 num,请你找出同时满足下面全部要求的两个整数: 两数乘积等于 num 1 或 num 2以绝对差进行度量,两数大小最接近 你可以按任意顺序返回这两个整数。 示例 1: 输入:num 8 输出:[3…

光子神经网络登上nature,图像识别速度降至1纳秒

文 | Alex(凹非寺)源 | 量子位比深度神经网络速度还快的是什么?或许光子DNN可以回答这个问题。现在,美国研究者开发的一个光子神经网络(photonic deep neural network,PDNN),让图像识别仅需1纳秒。1纳秒是什…

LeetCode 1363. 形成三的最大倍数(贪心,难)

1. 题目 给你一个整数数组 digits,你可以通过按任意顺序连接其中某些数字来形成 3 的倍数,请你返回所能得到的最大的 3 的倍数。 由于答案可能不在整数数据类型范围内,请以字符串形式返回答案。 如果无法得到答案,请返回一个空…

Spring Boot中使用Spring Security进行安全控制

我们在编写Web应用时,经常需要对页面做一些安全控制,比如:对于没有访问权限的用户需要转到登录表单页面。要实现访问控制的方法多种多样,可以通过Aop、拦截器实现,也可以通过框架实现(如:Apache…

这篇寒门博士论文致谢火了:回首望过去,可怜无数山

源 | 奔流新闻兰州晨报 记者 邢剑扬、安之若素德之至 微信平台、澎湃新闻“可怜无数山”近日,一位甘肃籍博士的论文致谢和回望“火”了,有网友称读后“泪眼婆娑,戳到了灵魂”,也有网友评价“一字一句,熠熠生辉”。“回…

Spring Boot中的事务管理

什么是事务? 我们在开发企业应用时,对于业务人员的一个操作实际是对数据读写的多步操作的结合。由于数据操作在顺序执行的过程中,任何一步操作都有可能发生异常,异常会导致后续操作无法完成,此时由于业务逻辑并未正确…

C++类对象排序operator重载操作

类内默认含有this指针,bool operator(const T& a)类外则需要写两个参数,bool operator(const T& a, const T& b) class People { public:string name;int id;People(string n, int i):name(n),id(i){}bool operator(const People& a){r…

鹅厂计算机视觉,世界第二??

编 | 好困 桃子源 | 新智元腾讯的计算机视觉能力首次进入全球Top2的评分排名!Gartner最新发布的2022年度《Magic Quadrant for Cloud AI Developer Services》是业内权威的云计算评估报告之一,评估对象包括亚马逊、微软、谷歌等全球云厂商。在核心产品能…

Spring Boot中使用log4j实现http请求日志入mongodb

之前在《使用AOP统一处理Web请求日志》一文中介绍了如何使用AOP统一记录web请求日志。基本思路是通过aop去切web层的controller实现,获取每个http的内容并通过log4j将日志内容写到应用服务器的文件系统中。 但是当我们在集群中部署应用之后,应用请求的日…

程序员面试金典 - 面试题 01.02. 判定是否互为字符重排(哈希map)

1. 题目 给定两个字符串 s1 和 s2,请编写一个程序,确定其中一个字符串的字符重新排列后,能否变成另一个字符串。 示例 1: 输入: s1 "abc", s2 "bca" 输出: true 示例 2: 输入: s1 "abc&…

破局数据困境,迭代一年的终版解决方案竟是纯规则方法!

文 | Severus大家好,我是Severus,一个致力于做好中文自然语言理解的老程序员。一年前,我在萌屋的第一篇推文(在错误的数据上,刷到 SOTA 又有什么意义?)中,重点讲述了关系抽取任务所面…

程序员面试金典 - 面试题 01.03. URL化(字符串)

1. 题目 URL化。编写一种方法,将字符串中的空格全部替换为%20。假定该字符串尾部有足够的空间存放新增字符,并且知道字符串的“真实”长度。(注:用Java实现的话,请使用字符数组实现,以便直接在数组上操作。…

扩散模型又杀疯了!这一次被攻占的领域是...

文 | Yimin_饭煲从2020年的初出茅庐,到2021年的日趋火热,再到2022年的大放异彩,扩散模型(Diffusion Models) 正在人工智能学术界和工业界获取越来越多的关注。如果还不是特别了解扩散模型的朋友,可以阅读卖萌屋的几篇历史推文《扩…

程序员面试金典 - 面试题 01.04. 回文排列(哈希map)

1. 题目 给定一个字符串,编写一个函数判定其是否为某个回文串的排列之一。 回文串是指正反两个方向都一样的单词或短语。排列是指字母的重新排列。 回文串不一定是字典当中的单词。 示例1: 输入:"tactcoa" 输出:tru…

Spring Boot中对log4j进行多环境不同日志级别的控制

之前介绍了在《Spring boot中使用log4j记录日志》,仅通过log4j.properties对日志级别进行控制,对于需要多环境部署的环境不是很方便,可能我们在开发环境大部分模块需要采用DEBUG级别,在测试环境可能需要小部分采用DEBUG级别&#…

耗时四年,我们写了一本1400页的AI全栈技术手册

不知不觉写文章已经四年了。最开始是一个人,后来恰了恰饭,就招揽了很多比小夕厉害的小伙伴一起写。不知不觉已经积累了300多篇了。。三年以来,我跟小伙伴们原创的300篇深度学习、NLP、CV、知识图谱、跨模态等领域的入门资料、子方向综述、201…