那么多GAN哪个好?谷歌大脑泼来冷水:都和原版差不多

来源:量子位

概要:从2014年诞生至今,生成对抗网络(GAN)热度只增不减,各种各样的变体层出不穷。


从2014年诞生至今,生成对抗网络(GAN)热度只增不减,各种各样的变体层出不穷。有位名叫Avinash Hindupur的国际友人建立了一个GAN Zoo,他的“动物园”里目前已经收集了多达214种有名有姓的GAN。


DeepMind研究员们甚至将自己提出的一种变体命名为α-GAN,然后在论文中吐槽说,之所以用希腊字母做前缀,是因为拉丁字母几乎都被占了……



这还不是最匪夷所思的名字,在即将召开的NIPS 2017上,杜克大学还有个Δ-GAN要发表。


就是这么火爆!


那么问题来了:这么多变体,有什么区别?哪个好用?


于是,Google Brain的几位研究员(不包括原版GAN的爸爸Ian Goodfellow)对各种GAN做一次“中立、多方面、大规模的”评测,得出了一个有点丧的结论:


No evidence that any of the tested algorithms consistently outperforms the original one.


非常不严谨地翻译一下:


都差不多……都跟原版差不多……



比什么?


这篇论文集中探讨的是无条件生成对抗网络,也就是说,只有无标签数据可用于学习。选取了如下GAN变体:


MM GAN

NS GAN

WGAN

WGAN GP

LS GAN

DRAGAN

BEGAN


其中MM GAN和NS GAN分别表示用minimax损失函数和用non-saturating损失函数的原版GAN。



除此之外,他们还在比较中加入了另一个热门生成模型VAE(Variational Autoencoder,变分自编码器)。


对于各种GAN的性能,Google Brain团队选了两组维度来进行比较。


一是FID(Fréchet Inception Distance),FID的值和生成图像的质量负相关。


测试FID时用了4个数据集:MNIST、Fashion MNIST、CIFAR-10和CELEBA。这几个数据集的复杂程度从简单到中等,能快速进行多次实验,是测试生成模型的常见选择。


二是精度(precision、)、查全率(recall)和F1得分,用来衡量判别式模型的质量。其中F1是精度和查全率的调和平均数。


这项测试所用的,是Google Brain研究员们自创的一个数据集,由各种角度的三角形灰度图像组成。


△ 精度和查全率都高、高精度低查全率、低精度高查全率、精度和查全率都低的模型的样本

对比结果


Google Brain团队从FID和F1两个方面对上面提到的模型进行比较,得出了以下结果。


FID



通过对每个模型100组超参数的大范围搜索,得出的结论是GAN在训练中都对于超参数设置非常敏感,没有哪个变体能够幸免,也就说,哪个GAN也没能比竞品们更稳定。



从结果来看,每个模型的性能擅长处理的数据集不太一样,没有在所有数据集上都明显优于同类的。不过,VAE相比之下是最弱的,它所生成出的图像最模糊。



测试还显示,随着计算资源配置的提高,最小FID有降低的趋势。


如果设定一个FID范围,用比较多计算资源训练的“坏”模型,可能表现得比用较少计算资源训练的“好”模型要更好。


另外,当计算资源配置相对比较低的时候,所有模型的最小FID都差不多,也就是说,如果严格限制预算,就比较不出这些模型之间具有统计意义的显著区别。


他们经过比较得出的结论是,用能达到的最小FID来对模型进行比较是没有意义的,要比较固定计算资源配置下的FID分布。


FID之间的比较也表明,随着计算力的增加,最先进的GAN模型之间体现不出算法上的优劣差别。


精度、查全率和F1


Google Brain团队还用他们的三角形数据集,测试了样本量为1024时,大范围搜索超参数来进行计算的精度和查全率。


对于特定的模型和超参数设置,最高F1得分会随着计算资源配置的不同而不同,如下图所示:


△ 不同计算资源配置下各模型的F1、精度和查全率

论文作者们说,即使是一个这么简单的任务,很多模型的F1也并不高。当针对F1进行优化时,NS GAN和WGAN的精度和查全率都比较高。


和原版GAN相比


Google Brain团队还将这些变体和原版GAN做了对比。他们得出的结论是,没有实证证据能证明这些GAN变体在所有数据集上明显优于原版。


实际上,NS GAN水平和其他模型持平,在MNIST上的FID总体水平最好,F1也比其他模型要高。


相关链接


要详细了解这项研究,还是得读论文:


Are GANs Created Equal? A Large-Scale Study
Mario Lucic, Karol Kurach, Marcin Michalski, Sylvain Gelly, Olivier Bousquet
https://arxiv.org/abs/1711.10337


查找某种GAN变体,可以去文章开头提到的GAN Zoo:
https://github.com/hindupuravinash/the-gan-zoo



未来智能实验室致力于研究互联网与人工智能未来发展趋势,观察评估人工智能发展水平,由中国科学院虚拟经济与数据科学研究中心刘锋、石勇、和刘颖创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;构建互联网(城市)云脑架构,形成科技趋势标杆企业库并应用与行业与智慧城市的智能提升。


  如果您对实验室的研究感兴趣,欢迎支持和加入我们。扫描以下二维码或点击本文左下角“阅读原文”





本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498023.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 中获取file的长度为0_Java核心技术梳理-IO

一、引言IO(输入/输出),输入是指允许程序读取外部数据(包括来自磁盘、光盘等存储设备的数据)、用户输入数据。输出是指允许程序记录运行状态,将程序数据输出到磁盘、光盘等存储设备中。IO的主要内容包括输入、输出两种IO流,这两种流中又分为字…

Exception 和解决办法

1、 org.xml.sax.SAXParseException: The string "--" is not permitted within comments. 从错误描述来看发现是XML文件中的注释引起的异常,去掉配置文件中的中文注释或改用英文描述则可以通过后来发现是配置文件中采…

福布斯:2018年将改变世界的九股科技大趋势

来源:咕噜网 概要:2018年又会有哪些重要科技趋势会改变世界呢?《福布斯》杂志今天发表文章,公布了将会在明年及日后改变世界的9股科技大趋势。 据《福布斯》杂志北京时间12月4日报道,2017年即将结束。这一年&#xff0…

linux 备份mysql并上传_linux备份数据库并上传至远程服务器(定时执行shell进行ftp上传)...

#start shell 脚本#!/bin/bash#定义备份数据库时使用的用户名和密码db_user"root"db_passwd"111111"#定义FTP服务器地址、用户名、密码、目录ftp_url113.108.8.80ftp_userftpuserftp_passwd111111ftp_dir/mysql_backup/xxxx#数据库备份的路径backup_dir/ho…

BigDecimal 运用示例 与 DecimalFormat

代码: BigDecimal bd new BigDecimal( "99.11" );System.out.println( "scale" bd.scale() );System.out.println(bd);bd new BigDecimal( 5526 );bd bd.divide( new BigDecimal (1000) );System.out.println( "scale" bd.scale…

NIPS 2017上演:Google大神们将带来哪些「精彩」?

来源:雷克世界 作者:Christian Howard 编译:嗯~阿童木呀、我是卡布达 概要:Google在2017年NIPS大会将展现出色的影响力,约有450多名Google员工将会通过技术讲座、海报、研讨会、比赛以及教程等方式向更广泛的学术研究…

dict keys 取最后一个_一步一步学Python3(小学生也适用) 第十三篇: 字典Dict类型

前面我们已经学习了Python的字符串,列表,元组,这一篇我们将学习字典,字典的使用频率是非常高,跟前面几篇一样,只要你用Python编程,就避不开Python字典。一、创建字典字典由键(key&am…

select ... into ... 与 insert into .... select .... 语句

select ... into ... 示例: select t.SLIP_ID, t.CASE_ID, t.BARCODE, t.SHP_WT1, t.SHP_WT2, t.PK_DATE, t.REG_DATE, t.UPDATE into logizard.T06_CASE_DTL_TRN from logizard.T04_CASE_DTL_WK as t where t.SLIP_ID111缺陷:被插入数据的表&a…

三份研究报告,聚焦 AI 的三大主要话题

来源:36氪 概要:随着人工智能技术呈现出势不可挡的发展之势,围绕 AI 进行的相关研究数量也越来越多。 随着人工智能技术呈现出势不可挡的发展之势,围绕 AI 进行的相关研究数量也越来越多。 关于人工智能及其对经济的影响方面&…

adams打不开提示msc license_adams安装后打不开

虽然要支持正版……但是安装后打不开,借鉴了adams2017安装教程后台留言图片发自简书App1.首先我这么做是因为其实在安装过程中就有一次没找到路径 。所以该方法仅供参考。图片发自简书App此时我直接在“此电脑”内搜索“MSC.Software”了图片发自简书App耐心等待………

李彦宏乌镇谈人工智能:百度会很快和雄安宣布一个大的智能城市计划

来源:亿欧 概要:百度董事长兼CEO李彦宏谈到了人工智能给C端、B端以及供给侧等方面带来的影响和变革。 12月4日,2017世界互联网大会在乌镇如火如荼地进行,在主题为“人工智能:让生活更美好”的分论坛上,百度…

iBatis 事务控制 与 两表操作将SQL语句写入单表

事务控制 示例: // move data from temp_table to work_tabletry {sqlMapClient.startTransaction();T03SlipWk orderForm (T03SlipWk) session.get( "SLIP_WK" );moveOrderFormToWorkTable( orderForm.getSlipId() );moveProductsToWorkTable( orderFo…

android studio 制作表格_红爆网络的旅游排行榜视频制作其实很简单,赶快动手尝试...

随着手机短视频的蓬勃发展,在网络上出现了多种类型的红极一时的爆款视频,这其中很具有代表性的一种就是排行榜视频,旅游领域的排行榜视频自然也少不了。这些个排行榜视频看起来挺高大上,配上稍有激情的背景音乐,播放起…

2017全球大数据产业八领域典型公司盘点分析

来源:黑科技数据 概要:从微观视角细分领域分析大数据行业。 今天带大家从微观视角细分领域分析大数据行业。 大数据分析 大数据可视化 BI商业智能分析 大数据检索 产品大数据分析 大数据预测、咨询 大数据服务支撑平台 机器学习技术 “大数据分析、可视化…

mysql profile 调试sql_SQL Server profile使用技巧

介绍经常会有人问profile工具该怎么使用?有没有方法获取性能差的sql的问题。自从转mysql我自己也差不多2年没有使用profile,忽然profile变得有点生疏不得不重新熟悉一下。这篇文章主要对profile工具做一个详细的介绍;包括工具的用途和使用方法…

BPP 相关——01

1、InputPageUtil 2、EditPageUtil ---------------------------------------------------------------------------------------------------------- 1、InputPageUtil 功能简述:在输入画面中,总是显示最后一页,本页输入满了则自动跳到下…

传感器数据完善 AI 功能,激起机器人“网络效应”

来源:36氪 概要:传感器数据将有助于推动AI的发展。 AI系统也同时扩展我们处理数据的能力,并帮助我们发现这些数据的创造性用途。 现在我们都对AI很熟悉了,也知道算法的完善离不开海量的数据。数据量越大,算法给出的结…

mariadb用户群体mysql_MySQL/MariaDB用户账户管理

UsernameHostnameUsername:任意的字符串组合,只能包含基本意义的字符;可以包含"_"、"."、"-";Hostname:可以为FQDN(完全合格域名),域名,IP地址,可使用…

iBatis 相关

1、配置iBatis 返回类型&#xff08;例如&#xff0c;sum( ) 一个BigDeciaml列后 &#xff09; <select id"abatorgenerated_totalWt2" resultClass"java.math.BigDecimal" parameterClass"java.lang.String">select sum(shp_wt2) from T0…

比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类!

来源&#xff1a;本文作者PENG Bo&#xff08;http://t.cn/RY3MKSS&#xff09;&#xff0c;本文首发于作者的知乎专栏《技术备忘录》 读过AlphaGo Zero论文的同学&#xff0c;可能都惊讶于它的方法的简单。另一方面&#xff0c;深度神经网络&#xff0c;是否能适用于国际象棋这…