不懂卷积神经网络?别怕,看完这几张萌图你就明白了

本文来自AI新媒体量子位(QbitAI)

这篇文章用最简明易懂的方式解释了卷积神经网络(CNN)的基本原理,并绕开了里面的数学理论。

同时,如果想对从头开始构建CNN网络之类的问题感兴趣,作者推荐去读《 Artificial Intelligence for Humans Volume 3: Deep Learning and Neural Networks》中第10章节的内容。

不多说了,开始CNN之旅——

网络结构

CNN的模型通常建立在前馈神经网络模型之上,它的结构你也应该不陌生。不同是的,“隐藏层”将被以下这些层取代:

卷积层(Convolutional Layers)

池化层(Pooling Layers)

全连接层(稠密层,Dense Layers)

结构类似下图:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

卷积

在此阶段,输入图像被一个grid扫描,并作为输入传递到网络。之后,这个网络将一层卷积层应用于输入的图像,将它分割成包含3张图像的三维立方体结构。这3三张图像个框架分别呈现原图的红色、绿色和蓝色信息。

随后,它将卷积滤波器(也称神经元)应用到图像中,和用PhotoShop中的滤镜突出某些特征相似。例如在动画片《Doc And Mharti》中,用罗伯茨交叉边缘增强滤波器处理过的效果如下图所示:

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

 原图

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 处理后

可以想象,拥有100多个不同滤波器的神经网络筛选复杂特征的能力有多强大,这将大大助力它识别现实世界中事物。一旦神经网络已经将卷积滤波器应用到图像中,我们就能得到特征/激活图。

特征图谱会被指定区域内的特定神经元激活,比如我们将边缘检测滤波器添加到下面左图中,则它的激活图如右图所示:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 这些点代表0的行(表明这些区域可能是边缘)。在二维数组中,“30”的值表明图像区域存在边缘的可能性很高

激活层

当我们有了激活图,就能在其中让激活函数大显身手了,我们用研究人员的首选函数——ReLU激活函数(修正线性单元)举个例子。然而,一些研究人员仍然认为用Sigmoid函数或双曲切线能得到提供最佳的训练结果,但我不这么认为。

使用激活层是在系统中引入非线性,这样可以提高输入和输出的一般性。ReLU(x)函数只返回max(0、x)或简单地返回激活图中的负权值。

池化层

之后的最佳做法通常是在特征图中应用最大池化(或任何其他类型的池)。应用最大池化层的原理是扫描小型grid中的图像,用一个包含给定grid中最高值的单个单元替换每个grid:

640?wx_fmt=png&wxfrom=5&wx_lazy=1

这样做的重要原因之一是,一旦我们知道给定特征在一个给定的输入区域,我们可以忽略特征的确切位置将数据普遍化,减少过拟合。举个例子,即使训练精度达到99%,但拿到没见过的新数据上测试时,它的精确度也只有50%。

输出层

最大池化层后我们讲讲剩下的另一个激活图,这是传递给全连接网络的一部分信息。它包含一个全连接层,将上一层中每个神经元的输出简单映射到全连接层的一个神经元上,并将softmax函数应用到输出中,就是和我们之前提到的ReLU函数类似的激活函数。

因为我们将用神经网络将图片分类,因此这里使用了softmax函数。softmax输出返回列表的概率求和为1,每个概率代表给定图像属于特定输出类的概率。但后来涉及到图像预测和修复任务时,线性激活函数的效果就比较好了。

值得注意的是,讲到这里我们只考虑了单卷积层和单池层的简单情况,如果要实现最佳精度通常需要它们多层堆叠。经过每个完整的迭代后,通过网络反向根据计算损失更新权重。

原文地址:https://authomaton.blogspot.co.uk/2017/10/machine-learning-but-funner-02.html

本文作者:林鳞
原文发布时间:2017-10-20 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/453149.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

xrd连续扫描和步进扫描_一种提高xrd实验精度的方法

一种提高xrd实验精度的方法【专利摘要】本发明公开了一种提高XRD实验精度的方法,包括如下步骤:步骤1:将待测试样进行处理至表面平整光洁;步骤2:选用步进扫描方式对待测钢试样进行XRD实验,步进扫描方式的扫描…

2018双一流排名 计算机,2018中国双一流高校名单

目前全球范围内,比较有影响力的世界大学排名包括《QS世界大学排名》、《世界大学学术排名(ARWU)》、《泰晤士高等教育世界大学排名》、《usnews世界大学排名》和CWUR沙特阿拉伯全球大学评级中心世界大学排名。这些排名从各个方面对世界范围内的高校进行综合排名&…

交换机和集线器的区别

集线器采用的是共享带宽的工作方式,简单打个比如,集线器就好比一条单行道,“10M”的带宽分多个端口使用,当一个端口占用了大部分带宽后,另外的端口就会显得很慢。相反,交换机是一个独享的通道,它…

移动平台还有哪些创业机会

这是一个移动互联网创业的最好时代。 过去的2011年,国内大批创业者为移动互联网而疯狂。这个超过200亿元的市场牢牢吸引着他们,每天都有新鲜的主意转化为应用。 移动互联网时代的创业成本远小于互联网时代。创新工场创始人李开复在2011中国移动开发者大…

Swift封装 滑出式导航栏

前言: 本文将会创建以下几个主类: DWContainerViewController:这包含了左视图,中视图和右视图控制器的视图,并处理动画和滑动等操作。 DWCenterViewController:中央面板。 DWSidePanelViewController&#…

广东电网计算机专业笔试题目,广东电网笔试题目

广东电网笔试题目笔试是一种与面试对应的测试,是以填写的方法考核应聘者学识水平的重要工具。这种方法可以有效的测量应聘人的基本知识、专业知识、管理知识、综合分析能力和文字表达能力等素质及能力的差异。下面是小编为大家收集的广东电网笔试题目,希…

波特率和比特率

波特率(符号率),可以理解为传输介质实际能达到的电压变化,比如每秒可以改变多少次。 比特率,是逻辑层面上每秒能传输多少个比特。 考虑最简单的不归零编码,用5伏电压表示1,-5伏电压表示0&…

usart和uart 的区别

摘自:https://blog.csdn.net/meic51/article/details/7714847 什么是同步和异步 转自https://blog.csdn.net/seashine_yan/article/details/71192283转载于:https://www.cnblogs.com/chulin/p/8661720.html

苹果产品开发的绝密工作流程

长期以来苹果产品开发流程在很多方面都笼罩着一层神秘的面纱,而在AdamLashinsky新发行的《InsideApple:HowAmerica’sMostAdmired–andSecretive–CompanyReallyWorks》一书中对这些流程有所涉及。这本书同时谈论了苹果公司各个不同的方面,包括其理念、招…

Linux系统集群架构线上项目配置实战(一)

项目整体介绍 **整个项目包括以下几个应用工程** 1、 用户APP 2、 商家APP 3、 业务平台管理后台 4、 商家业务管理后台 5、 官网 **整体项目规划设计如下** 1、 用户APP采用JAVA环境布署,初始环境两台服务器,实现负载均衡与高可用,前端…

如何确定autosar的版本_AUTOSAR编码指南(中文版)

在汽车应用领域,软件开发变得越来越重要。随着安全、环境以及便利性需求的增长,车辆中应用电子系统的数量也在急速增长。其中有90%的创新应用都是基于软件驱动的电子组件。而这些组件的研发成本占车辆开发成本的40%,快速稳定的发展需要整合更…

3个月计算机考研,【图片】(重开)三个月考研成功的心路历程 -南邮计算机【南京邮电大学研究生院吧】_百度贴吧...

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼这个帖子教你如何在较短时间拿到大部分的分值。声明:这个经验是我个人的经历可能对有些人不适合 时间充裕的还是老老实实打基础,按部就班的三轮复习。18年考研 南邮 初试数据结构 复试微机原理 。我是国庆之…

PS把一张白色背景的图片设为透明

方法一: 1.双击图层缩略图上的小锁图标(注意,这里不要拖动小锁进行删除锁定),弹出“新建图层”,确定 2.右键左侧第四个功能菜单,选择魔棒工具 3.用魔棒工具在白色背景区域点击一下,选…

HTML5 webfont字体图标的使用

2019独角兽企业重金招聘Python工程师标准>>> 一.参考文献 1.http://www.cnblogs.com/yes-V-can/p/5716853.html 2.http://blog.csdn.net/zhouwangling_/article/details/53096649 二.html使用方法 1.下载字体 网上百度自己要使用的字体,一般下载的是ttf格…

算法导论中英文版下载

算法导论: 学过计算机的都知道,这本书可以说是全世界最权威的算法课程的大学课本了,基本上全世界的名牌大学用的教材都是它。这本书一共四位作者,Thomas H. Cormen,Charles E. Leiserson 和 Ronald L.Rivest 是来自 MI…

javaweb不同用户需要几张表_程序员必备2020版:JavaWeb快速进阶全套教程

Java Web应用由一组Servlet、HTML页、类、以及其它可以被绑定的资源构成。它可以在各种供应商提供的实现Servlet规范的Servlet容器中运行。JavaWeb项目简单来说就是一个应用程序,比如每天打开的QQ、微信、百度地图等,这些都是应用程序。有很多同学反应Ja…

遇见未来的自己作文800计算机,遇见未来的自己作文800字

如果给你一个机会让你遇见未来的自己,并且有两个不一样的人生,任意选择其中一个,你愿意去遇见吗?在我的面前,有两扇门。可以看见其中一扇门上写着“少时享受的未来,而另一扇门上写着“少时勤奋的未来”。这…

ZOJ.3551.Bloodsucker(期望DP)

题目链接 \(Description\) 有1个吸血鬼和n-1个人,每天有且只会有两个人/吸血鬼相遇,如果是人与吸血鬼相遇,那个人会有p的概率变成吸血鬼;否则什么也不发生。求n个都变成吸血鬼的期望天数。 \(Solution\) 我还是写一下吧。。期望题…