惠州网站营销推广网站哪里可以做

web/2025/10/2 10:59:25/文章来源:
惠州网站营销推广,网站哪里可以做,药品销售推广方案,网站设计主要做什么点击蓝字关注我们AI研习图书馆#xff0c;发现不一样的世界风格迁移图像风格化迁移是一个很有意思的研究领域#xff0c;它可以将一张图的风格迁移到另外一张图像上#xff0c;由此还诞生了Prisma和Ostagram这样的商业化产品。本文#xff0c;我们将介绍谷歌大脑团队的一篇… 点击蓝字关注我们AI研习图书馆发现不一样的世界风格迁移图像风格化迁移是一个很有意思的研究领域它可以将一张图的风格迁移到另外一张图像上由此还诞生了Prisma和Ostagram这样的商业化产品。本文我们将介绍谷歌大脑团队的一篇很有影响力的论文: Exploring the structure of a real-time, arbitrary neural artistic stylization network该论文提出了一种任意内容、任意风格的图像风格化迁移算法。大佬已经将算法demo整合进了aizoo.com欢迎进入网址在线体验。在深度学习引进图像风格迁移之前图像风格化一般称作图像纹理合成或者图像纹理迁移。在2015年Leon Gatys等学者开始将深度学习引入到图像风格合成领域从那时起图像风格化迁移这个名字才开始用起来。从2015年到2017年图像风格化迁移领域经过了火箭般的发展。其发展路线主要有以下三个阶段单内容单风格模型任意内容单风格模型任意内容、任意风格模型有意思的是图像风格迁移领域基本是沿着这三个阶段一脉相承的发展下来的每一代算法都有借鉴前一个阶段的算法成果。真正做到了前人的成果后人的阶梯。虽然本文写作于2020年2月6日但今天我们要重点介绍的该论文是谷歌大脑团队2017年8月发布的。我们参考Reiichiro大神于2018年开源的代码和模型我们很快的就将他部署到了我们的网站aizoo.com。但是我并不清楚该算法的原理和细节为了弄明白这篇论文我仔细阅读了该论文以及其参考文献中的部分经典、高被引参考论文结合谷歌开源的代码我才算是真正搞懂了这篇文章。对于如果要研究图像风格化迁移的新手直接看懂这篇文章还是蛮困难的。所以本文将用清晰、简洁的方式介绍这篇论文提到核心的算法。正如上面提到图像风格化迁移领域的发展是一脉相承的该论文也使用了之前两个阶段的其他论文中的很多方法所以我们先对图像风格迁移领域的发展历程进行简单的介绍。01单内容单风格模型顾名思义这种模型就是对每一张内容图片和每一张风格图片都需要单独建模一般是对一张随机噪声图不断的迭代优化使生成图的风格类似于给定的风格图内容却与给定的内容图像一致。Gatys等学者发表的Image Style Transfer Using Convolutional Neural Networks是图像风格化迁移领域的开山之作。该论文主要使用预训练的VGG网络来提取特征一般我们认为VGG这类图像分类网络其浅层会更多的保存图像的纹理信息而深层更多的是图像的语义特征。所以如果两张图片内容相似他们的高层特征的欧式距离会比较小如果两张图像的纹理相似那么它们的低阶特征有相同的空间特性。所以多数图像风格化模型都会使用VGG等图像识别模型的特征来计算纹理相似性和内容相似性并且一般都会使用VGG等网络的多个卷积层提取的特征来计算风格损失并使用一个较深的卷积层提取的特征来计算内容损失。如下图所示对于风格图像S、内容图像C、生成的风格化迁移图像X分别输入VGG网络并在如图所示的四个卷积层的特征来计算风格损失使用relu3_3的输出的特征来计算内容损失。对于图像风格损失一般会将提取到的特征转换为Gram矩阵用Gram矩阵来表示纹理信息。Gram矩阵计算方法就是将每个卷积层输出的特征向量(一般为WxHxC维)reshape成WHxC的矩阵然后该二维矩阵的转置与自身相乘得到一个CxC的矩阵使用这个矩阵表示该层的风格。则第j层的风格损失定义如下总的风格损失定义如下内容损失为内容图像和生成的风格化图像的特征之间的均方误差第j层内容损失定义为总的内容损失如下最终的损失为风格损失和内容损失的一个加权和(其中λ为内容损失的权重)而网络的优化方向就是最小化总的损失。单内容、单风格模型很明显不实用因为我们总不能让用户每次输入一张内容图和风格图都用GPU迭代几分钟才给出结果吧。虽然工程上并不实用但是该类算法提出使用VGG等预训练模型的特征进而计算风格损失和内容损失后面的风格化算法损失函数计算方式基本沿袭于此。02任意内容单风格模型这类模型是对图像风格迁移网络进行训练图像风格迁移网络一般是自编码器架构(AutoEncoder)输入任意一张内容图模型可以直接输出风格化的图片。该类算法需要对一张特定风格图进行训练在推理的时候可以对任意内容进行风格化这类网络的推理速度也比较快。但该类模型依旧有缺陷因为对每个风格都需要建模如果要做成产品假设有1千个风格图就要训练一千个模型这样存储、调用起来仍旧不方便。虽然后来有学者提出了单模型多风格的模型一个典型的论文是A Learned Representation For Artistic Style模型结构如上图所示一个风格迁移模型可以存储几十种不同的风格但仍旧不能做到风格随意切换。但这篇论文提出的一个条件实例归一化方法(conditional instance normalization)对下面要重点介绍的文章是一个非常大的启发。还记得我们经常用的Batch Normalization吗其原理非常简单对于每个卷积层中每个通道的特征我们计算其均值和标准差然后对每个通道的每个数值减去均值除以标准差然后乘以一个可学习的参数γ再加上一个可学习的偏置β。该论文提出使用这个γ和β来做作为风格图像的特征向量即使用这γ和β值来作为风格迁移网络的部分BN层的γ和β值进而控制风格迁移网络生成符合特定风格的图像。该文章提出可以存储N个不同风格图像的γ和β矩阵每次生成不同风格的图像时只需要切换不同的风格对应的γ和β矩阵就可以生成不同风格的风格迁移图。03任意内容任意风格模型后来有学者提出了任意图像的风格化其有多种不同的方法下面我们介绍一下本文要重点介绍的论文也就是谷歌大脑团队提出的——Exploring the structure of a real-time, arbitrary neural artistic stylization network.还记得上面刚提到的条件实例归一化方法吗谷歌大脑团队提出如果训练一个风格预测网络让它来生成每个风格图像的特征向量(也就是要强加给风格迁移网络的γ和β)然后输送给图像生成模型不就完事了吗只要这个风格预测网络性能足够强就可以做到任意风格的图像生成了。这里有一定会让大家比较迷惑的地方也是让笔者一开始自己百思不得其解的地方。我们通常所见的一个模型的结果作为另一个模型的一个输入一般是与其他特征进行通道拼接、或者通道逐元素相加而本篇论文则是把一个模型的输出作为另外一个模型的部分BN层中的γ和β参数。这是本文一个非常特别的地方。明晰了这一点本篇文章就很好理解了。下面是论文的主体结构图其中风格转换网络是一个AutoEncoder架构的网络不过这个网络只有两个下采样层。下表是风格转换网络的结构组成。其中每个Residual block(残差块)由两个卷积层和一个shortcut组成而Upsampling(上采样层)则是由一个最近邻差值(2倍上采样)和一个卷积层组成。但别忘了最重要的每个卷积层的后面都有BN层其中前三个卷积层是普通BN层而后面5个残差块中的十个卷积层以及两个上采样中的两个卷积层还有最后一个卷积层都是使用上文提到的条件实例归一化的也就是这13个归一化层的β和γ来自于风格预测网络。其中风格预测网络是Inception V3模型不过并不是完整的Inception V3模型而是只使用其截止到名称为“mixed 6e”的上半部分模型该部分作为风格预测网络的Backbone网络然后对输出进行一个全局平均池化再使用一个1x1的卷积层将通道数降低为100其实这个100就可以作为一个风格图像的特征了。但是等等不是说风格预测网络的输出是上述13个卷积层对应的归一化参数β和γ吗是的所以这个100个通道的卷积层还要分别再接出来26个1x1的卷积层(分别是13个卷积层的γ和13个卷积层的β矩阵所以一共26个卷积层)这26个1x1卷积层的通道数目对应风格迁移网络中相应层的通道数。26个卷积层输出的结果才是最终送到风格转换模型的β和γ向量。下表是风格生成网络的结构图其中最后的Matrix multiply其实是1x1的卷积层这点还是通过看源码看到的。明白了网络的完整的拓扑结构对这篇文章就算有个清晰的理解了。对于训练就很容易理解了。其损失同样是上文提到的通过VGG网络提取的特征来计算风格损失和内容损失优化器优化这个总的加权损失就可以了。该论文在8万张艺术画和6千张视觉纹理图上训练最后作者还验证了风格预测网络在网络从未见过的风格图片上仍然具有很好的风格建模能力。这点非常类似于人脸识别模型一个识别模型在成千上万的人脸图片上训练好了对于未见过的人脸也需要对其进行很好的建模而不能瞎预测。而一旦训练好了风格预测模型以及风格生成模型网络就可以任意输入一张内容图片以及一张风格图片网络就可以很快的生成一张风格化的图片了。其实文章介绍到这里最难理解的地方就介绍完了下面是关于将模型通过TensorFlow.js部署到浏览器里面的一些技术细节由于Inception v3模型比较大Reiichiro将模型进行了蒸馏使用Mobilenet v2替换Inception v3模型作为风格预测网络并将图像风格迁移网络中部分的卷积层替换为了深度可分离卷积层。从而降低了两个模型的大小。模型名称模型大小(MB)推理时间(s)图像风格转换模型Inception v336.30.439Mobilenet v29.60.047图像风格生成模型标准卷积结构7.92.51深度可分离卷积结构2.40.90下面我们实现的操作页面您可以在浏览器输入aizoo.com/style-transfer.html进行体验。我们默认使用小的模型在图中右侧控制栏有个“使用大模型”可选项您可以选择大模型大模型更‘鲜艳“一些。不过40多M的模型下载可能需要几秒钟而且运算量也要大很多所以相比小模型速度会慢很多。最后说一下学习风格化算法和这篇论文的感悟。因为之前并没有深入研究过图像风格化算法但我为了介绍这个可以跑在浏览器里的算法仔细看了这篇文章读了几篇其他作者写的综述性介绍文章又阅读了几篇该论文里面提到的部分参考文献最重要的是看了源码才把一些很难想通的点看明白了。所以开始一个新的研究方向或许以下三点是入门的一个很好的点1)阅读综述性的论文和博客找出文中重点提到的经典论文2)阅读该方向经典的论文以及经典论文所参考的部分高被引文献3)阅读部分经典论文的开源代码其中阅读代码可能是理解一篇论文最重要的就像目标检测中的SSD或者Yolo论文如果看论文或许有很多点是看不很明白的只有看代码或者真正自己通过写代码实现这个算法才能彻底搞懂它。最后欢迎关注我们的公众号如果您想体验跑在您浏览器的图像风格化算法敬请访问aizoo.com更多好玩的人工智能算法在里面等你哦。参考文献Image Style Transfer Using Convolutional Neural Networks A Learned Representation For Artistic StyleNeural Style Transfer: A ReviewPorting Arbitrary Style Transfer to the Browser  https://magenta.tensorflow.org/blog/2018/12/20/style-transfer-js/推荐阅读文章[1] AI入门-人工智能的前世今生[2] AI入门-深度学习综述[3] AI入门-计算机视觉学习指南[附资源][4] 深度学习框架总结—国际篇[5] 深度学习-CNN结构设计技巧[6] 资源分享-深度学习及数据分析等资源合集[7] 今日分享—统计学习方法[8] 算法总结—人脸检测算法[9] 目标检测算法-YOLOv4 [10] 项目总结—人脸检测[11] 数据结构与算法-Python语言案例实现[12] 深度学习基础-二十种损失函数[13] 深度学习-目标检测的十九个研究方向[14] 项目实战-车辆检测案例实现[15] 卷积神经网络-可变形卷积[上][16] 图像识别—EfficientNet算法详细总结[17] 世界读书日—机器学习西瓜书|附下载链接[18] 面试指南-算法岗如何针对性的准备校招面试   ......点击在看了解更多精彩内容转载是一种动力 分享是一种美德公众号 :AI研习图书馆CSDN博客算法之美DLGitHubstatisticszhang关注AI研习图书馆发现不一样的精彩世界

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/85583.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建设网站成本预算开发公司网签物料

LabVIEW开发航天器动力学与控制仿真系统 计算机仿真是工程设计和验证的非常有用的工具。它节省了大量的时间、金钱和精力。航天器动力学与控制仿真系统由LabVIEW程序开发,它是模拟航天器等动态系统的有用工具。还可轻松与硬件连接并输出真实信号。 项目采用系统工…

绵阳做手机网站建设如何建立自己推广网站

功能介绍 Oracle数据库在创建sequence的时候可以支持设置nomaxvalue,这样的SQL在LightDB 23.3版本之前都是执行失败的。为了方便Oracle用户迁移到LightDB上,在LightDB 23.3版本上,增加了sequence支持设置nomaxvalue的语法兼容。 nomaxvalue内…

彩票网站开发制作网页简单制作流程

我想知道怎么求N的N次方&#xff0c;这个数据是很大的&#xff0c;但是我要的是这个数据的最高位的数&#xff0c;应该有什么好的方法吧&#xff01; 请大侠们帮帮忙吧&#xff01;&#xff01;&#xff08;N <1000000000&#xff09; 这个问题提出后&#xff0c;fallening同…

电商网站开发教程网站备案号怎么查

我同意TigerhawkT3&#xff08;1&#xff09;你教授对pick_color()的实现是垃圾。但我不认为random.choice()&#xff0c;或者你教授滥用random.shuffle()的方式是最好的选择。两者的问题是&#xff0c;在连续调用时可以获得相同的颜色&#xff0c;这是在正方形内绘制正方形时不…

网页游戏网站官网网站怎么做推广和宣传

1.枚举 枚举是一种特殊类 2.枚举类的格式 注意&#xff1a; ①枚举类中的第一行&#xff0c;只能写一些合法的标识符(名称)&#xff0c;多个名称用逗号隔开。 ②这些名称&#xff0c;本质是常量&#xff0c;每个常量都会记住枚举类的一个对象。 3.枚举类的特点 ①枚举类的…

上海高端网站建设公司网站 keywords

发布时间&#xff1a;2017-05-12我的世界战舰设计图 手机版战舰怎么做.那下面给大家分享的是玩家自己在手机版中手撸的一个战舰建筑哦~那感兴趣的玩家不妨进来看看他是怎么建造战舰的哦~希望大家喜欢. 游戏园我的世界官方群:325049520 二群:25607 ...标签&#xff1a;我的世界 …

免费制作app生成器网站济南网站建设运营

osgi架构与linux在构建可扩展&#xff0c;可靠的分布式系统的背景下&#xff0c;“模块化”和“微服务体系结构”这两个术语如今经常出现。 众所周知&#xff0c;Java平台本身在模块化方面很弱&#xff08; Java 9将通过交付Jigsaw项目来解决此问题&#xff09;&#xff0c;这为…

网站建设公司专业网站开发需求企业电话认证

Linux mesg命令介绍 Linux mesg命令用于设置终端机的写入权限。当mesg设置为y时&#xff0c;其他用户可以利用write指令将信息直接显示在您的屏幕上。如果设置为n&#xff0c;则不允许其他用户将信息直接显示在你的屏幕上。 Linux mesg命令适用的Linux版本 mesg命令在大多数…

电商网站的建设与安全wordpress关闭分享

官方提供的教程介绍了通过钉钉、微信等工具接收短信验证码的方法&#xff0c;但最终实现的目的是获取验证码&#xff0c;而不是通过工具间接获得。 因此&#xff0c;我们可以直接调用API接口来获取验证码&#xff0c;从而达到更快、更便捷地获得验证码的目的。 所以做了一个服…

网页设计作业欣赏seo会被取代吗

注&#xff1a;本文写的内容全部在ubuntu12.04下完成。要在linux下写C程序&#xff0c;要懂的一点编译的知识。下面介绍一下。源代码->预处理器(负责将代码补充)->汇编程序(生成汇编语言)-> 目标程序(生成二进制文件)->链接器(链接文件)->可执行程序(生成执行程…

建网站详细教程用c 建网站时怎么做导航菜单栏

首先在我们可以直接写到需要的 page 中&#xff0c;然后再进行抽取组件&#xff0c;自定义组件建议wxzx-xxx命名例如&#xff0c;我们封装的组件名为 **wxzx-loadmorewxzx-loadmore.wxml正在加载{{tip}}这里就是把index.wxml中的需要封装成组件的代码原样copy过来wxzx-loadmore…

纯净软件网站推荐网站建设需要知识

MBR分区主分区&#xff1a;14&#xff0c;一块硬盘最多4个主分区&#xff0c;对主机必须有&#xff0c;主分区可以格式化ntfs&#xff0c;存数据。扩展分区&#xff1a;14&#xff0c;一块硬盘最多一个扩展分区&#xff0c;可以没有扩展分区&#xff0c;可以划分成更小的单元&a…

韶关住房和城乡建设局网站设计师网站1688

李博洋 OceanBase 技术部研发工程师。 OceanBase 开源社区里经常会看到一些类似于 “ schema 是什么” 的疑问&#xff1a; 很多同学经常会误以为在 OceanBase 里&#xff0c;schema 只是 database 的同义词&#xff0c;这次分享就从 schema 是什么这个问题稍微展开聊一下。 首…

安徽网站建设公司哪家好网站域名价值查询

1、data指令 基本语法&#xff1a; date &#xff1a; 显示当前时间date %Y : 显示当前年份date %m &#xff1a; 显示当前月份date %d &#xff1a; 显示当前哪一天date “%Y-%m-%d %H:%M:%S" &#xff1a; 显示年月日时分秒date -s 字符串时间 &#xff1a; 设置系统时…

南京电商网站设计公司wordpress自定义post

三菱PLC应用[集锦] 如何判断用PNP还是NPN的个人工作心得 10&#xff5e;30VDC接近开关与PLC连接时&#xff0c;如何判断用PNP还是NPN的个人工作心得: 对于PLC的开关量输入回路。我个人感觉日本三菱的要好得多&#xff0c;甚至比西门子等赫赫大名的PLC都要实用和可靠&#xff01…

苏州建网站的公司哪家公司好电子商务营销策略分析

摘要&#xff1a;开源技术的学习和采用确实存在着一定门槛&#xff0c;然而学习各种开源项目已经成为许多开发者不可回避的工作内容。那么&#xff0c;对于类似OpenStack的大型开源项目&#xff0c;开发者该如何着手&#xff0c;这里我们看章宇的分享。 【编者按】在 上一届O…

网站开发设计实训总结网页设计与制作教程电商

Codrops 分享了一些给SVG元素加上弹性动画的灵感。实现的思路是把一个SVG元素整合成一个组件&#xff0c;然后从一个路径弹性动画到另一个。这种效果可以应用到像菜单&#xff0c;按钮或其它元素&#xff0c;使得交互更有趣&#xff0c;看起更原生与自然的感觉。 在线演示 …

中英文网站栏目修改清华紫光网站建设

问题背景 在软件开发过程中&#xff0c;本地环境与服务器环境之间的差异可能导致意外的运行时错误。本文将探讨一个常见的问题&#xff1a;在本地环境中使用 Gson 库解析 JSON 数据时日期字段正常解析&#xff0c;但部署到 Linux 服务器上时却出现 JsonSyntaxException 错误。…

揭阳建站服务软件界面设计方案

vee-validate 是为 Vue.js 量身打造的表单校验框架&#xff0c;允许您校验输入的内容并显示对应的错误提示信息。它内置了很多常见的校验规则&#xff0c;可以组合使用多种校验规则&#xff0c;大部分场景只需要配置就能实现开箱即用&#xff0c;还支持自定义正则表达式。而且支…

大方泳嘉网站建设网站关于我们页面设计

提出了一种基于人工智能深度强化学习算法的扩展性及智能性较高的智能选择模式。在人工智能深度强化学习 算法的基础上&#xff0c;引入了动作抑制、四重 Q 学习 (QQL) 及归一化 Q-value 等机制&#xff0c;研究并实现了在满足业务延迟要求及公平 性的原则下&#xff0c;物联终端…