深度学习不能取代计算机视觉技术背后的真正原因

来源:电子发烧友

深度学习只是一种计算机视觉工具,而不是包治百病的良药,不要因为流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,了解它们可以为你省去很多的时间和烦恼;并且掌握传统计算机视觉确实可以让你在深度学习方面做得更好。这是因为你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。

本文的灵感同样来自论坛中的一个常见问题:

深度学习已经取代了传统的计算机视觉吗?

或是换种说法:

既然深度学习看起来如此有效,是否还有必要学习传统的计算机视觉技术?

这个问题很好。深度学习确实给计算机视觉和人工智能领域带来了革命性的突破。许多曾经看似困难的问题,现在机器可以比解决的比人类还好。图像分类就是最好的印证。确实,如从前所述,深度学习有责任将计算机视觉纳入行业版图。

但深度学习仍然只是计算机视觉的一个工具,且显然不是解决所有问题的灵丹妙药。因此,本文会对此进行详细阐述。也就是说,我将说明传统的计算机视觉技术为何仍十分有用,值得我们继续学习并传授下去。

本文分为以下几个部分/论点:

深度学习需要大数据

深度学习有时会做过了头

传统计算机视觉将会提升你的深度学习水平

进入正文之前,我认为有必要详细解释一下什么是“传统计算机视觉”,什么是深度学习,及其革命性。

背景知识

在深度学习出现以前,如果你有一项诸如图像分类的工作,你会进行一步叫做“特征提取”的处理。所谓“特征”就是图像中“有趣的”、描述性的、或是提供信息的小部分。你会应用我在本文中称之为的“传统计算机视觉技术”的组合来寻找这些特征,包括边缘检测、角点检测、对象检测等等。

在使用这些与特征提取和图像分类相关的技术时,会从一类对象(例如:椅子、马等等)的图像中提取出尽可能多的特征,并将其视为这类对象的“定义”(称作“词袋”)。接下来你要在其它图像中搜索这些“定义”。如果在另一个图像中存在着词袋中相当一部分的特征,那么这个图像就被归为包含那个特定对象(如椅子、马等等)的分类。

这种图像分类的特征提取方法的难点在于你必须在每张图像中选择寻找哪些特征。随着你试图区分的类别数目开始增长,比如说超过 10 或 20,这就会变得非常麻烦甚至难以实现。你要寻找角点?边缘?还是纹理信息?不同类别的对象最好要用不同种类型的特征来描述。如果你选择使用很多的特征,你就不得不处理海量的参数,而且还需要自己来微调。

深度学习引入了“端到端学习”这一概念,(简而言之)让机器在每个特定类别的对象中学习寻找特征,即最具描述性、最突出的特征。换句话说,让神经网络去发现各种类型图像中的潜在模式。

因此,借助端到端学习,你不再需要手动决定采用哪种传统机器视觉技术来描述特征。机器为你做好了这一切。《连线》杂志如此写道:

举例来说,如果你想教会一个 [深度] 神经网络识别一只猫,你不必告诉它去寻找胡须、耳朵、毛或是眼睛。你只需展示给它成千上万的猫的图像,它自然会解决这一问题。如果它总是会将狐狸误认为是猫,你也不用重写代码。你只需对它继续进行训练。

下图描述了特征提取(使用传统计算机视觉)和端到端学习之间的这种区别:

以上就是背景介绍。现在接着讨论为什么传统计算机视觉仍然必不可少,而且学习它仍大有裨益。

深度学习需要大量数据

首先,深度学习需要数据,许许多多的数据。前文提到过的著名图像分类模型的训练都基于庞大的数据集。排名前三的训练数据集分别是:

ImageNet——150 万图像,1000 个对象分类/类别;

COCO——250 万图像,91 个对象分类;

PASCAL VOC——50 万图像,20 个对象分类。

但是一个训练不良的模型在你的训练数据之外很可能表现糟糕,因为机器并没有对于问题的洞察力,也就不能在没看到数据的情况下进行概括归纳。而且对你来说查看训练模型内部并进行手动调整又太过困难,因为一个深度学习模型内部拥有数以百万计的参数——每个参数在训练期间都会被调整。某种程度上说,一个深度学习模型就是一个黑箱。

传统的计算机视觉完全透明,允许你更好地评估判断你的解决方案是否在训练环境之外依然有效。你对问题的深入见解可以放进你的算法之中。并且如果任何地方出现故障,你也可以更轻易地弄清楚什么需要调整,在哪里调整。

深度学习有时做过了头

这大概是我最喜欢的支持研究传统计算机视觉技术的理由。

训练一个深度神经网络需要很长的时间。你需要专门的硬件(例如高性能 GPU)训练最新、最先进的图像分类模型。你想在自己还不错的笔记本上训练?去度个一周的假吧,等你回来的时候训练很可能仍未完成。

此外,如果你的训练模型表现不佳呢?你不得不返回原点,用不同的训练参数重做全部工作。这一过程可能会重复数百次。

但有时候所有这些完全没必要。因为传统计算机视觉技术可以比深度学习更有效率地解决问题,而且使用的代码更少。例如,我曾经参与的一个项目是检查每个通过传送带的罐子里是否有一个红勺子。现在你可以通过前文叙述的旷日持久的过程来训练一个深度神经网络去检测勺子,或者你也可以写一个简单的以红色为阈值的算法(将任何带有一定范围红色的像素都标记为白色,所有其它的像素标记为黑色),然后计算有多少白色的像素。简简单单,一个小时就可以搞定!

掌握传统的计算机视觉技术可能会为你节省大量的时间并减少不必要的烦恼。

传统计算机视觉会提升你的深度学习技巧

理解传统的计算机视觉实际上能帮你在深度学习上做得更好。

举例来说,计算机视觉领域最为普遍使用的神经网络是卷积神经网络。但什么是卷积?卷积事实上是一种被广泛使用的图像处理技术(比如,索贝尔边缘检测)。了解这一点可以帮助你理解神经网络内部究竟发生了什么,从而进行设计和微调以更好地解决你的问题。

还有一件事叫做预处理。你输入给模型的数据往往要经过这种处理,以便为接下来的训练做准备。这些预处理步骤主要是通过传统的计算机视觉技术完成的。例如,如果你没有足够的训练数据,你可以进行一个叫做数据增强的处理。数据增强是指对你训练数据集中的图像进行随机的旋转、移动、裁剪等,从而创造出“新”图像。通过执行这些计算机视觉操作,可以极大地增加你的训练数据量。

结论

本文阐述了为什么深度学习还没有取代传统计算机视觉技术,以及后者仍值得学习和传授。首先,本文将目光放在了深度学习往往需要大量数据才能表现良好这一问题上。有时并不具备大量数据,而传统计算机视觉在这种情况下可作为一种替代方案。第二,深度学习针对特定的任务偶尔会做过头。在这些任务中,标准的计算机视觉比起深度学习可以更为高效地解决问题,并且使用更少的代码。第三,掌握传统计算机视觉确实可以让你在深度学习方面做得更好。这是因为你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。

总而言之,深度学习只是一种计算机视觉的工具,而不是包治百病的良药。不要因为流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,了解它们可以为你省去很多的时间和烦恼。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/488876.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

win10控制面板快捷键_你没玩过的全新版本Win10,这些操作你知多少?

不知不觉,Windows 10与我们相伴已经整整四个年头了,从最开始的组团抗拒到现在的默默接受,个中滋味相信谁心里都有个数。近日微软开始推送“Win10更新五月版”,那么Win10中到底都有哪些“骚”操作?一起来看看吧。1、夜间…

1.编写登录接口

需求:.编写登录接口输入用户名密码认证成功后显示欢迎信息输错三次后锁定 # Author rendeleiwhile True: list1 [] list2 [] count int(3) f open("login.txt",‘w’) for line in f: hostname str(line.split(\t)…

吴恩达邀请9位AI大牛畅想2020:李开复看好医疗教育,LeCun强调自监督学习

来源:凹非寺2020,AI的研究会有哪些突破?2020,AI的应用又会有什么变化?吴恩达DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann LeCun、李开复、周志华、还有他们的老板吴恩达在内的10位AI大佬的新年寄语…

R pdf大小_限时免费获取 Mac上PDF压缩工具《Enolsoft PDF Compressor》

文章末尾有获取方式,按照以下步骤就能得到。我们不破解软件,所有优秀软件均来源于网络你的pdf文件太大使用不方便吗?赶紧来试试专业PDF压缩工具Enolsoft PDF Compressor破解版吧!可以快速的压缩PDF文件的大小,支持批量…

未来十年有望改变世界的五大发现

来源:科技日报 浮云一别后,流水十年间!21世纪第二个十年已悄然离开。过去十年,不少革命性突破和发现给人类生活和认知带来重大变革:希格斯玻色子填补了“标准模型”最后一块拼图,深化了人类对物质本质的理解…

fceux模拟器linux,FCEUX模拟器

FCEUX模拟器是一款游戏模拟器,可以用于FC/NES模拟器的游戏模拟,在模拟器中玩家可以游玩到那些经典的FC游戏,也就是我们所说的那些红白机游戏,比如经典的魂斗罗、超级马里奥等等,让你回到过去,回温这些经典的…

el-table 树形表格 自定义展开图标_Image2icon for Mac(icon图标设计软件)

image2icon mac破解版是运行在Mac OS平台上的专业图标制作工具,用它可以创建你自己的Mac图标,并自定义文件和文件夹的icon图标。image2icon mac功能介绍轻松创建图标 厌倦了你的标准mac图标?您想个性化您的文件或文件夹吗?Image2i…

科技创新2030“新一代人工智能”重大项目2020年度第一批项目申报指南建议征求意见稿...

来源:锐动源编辑部设计:种 瑞审核:李建荣根据《国务院关于改进加强中央财政科研项目和资金管理的若干意见》(国发〔2014〕11号)、《国务院关于深化中央财政科技计划(专项、基金等)管理改革方案…

同时多个axios请求_用 React+Antd 封装 Axios 实现全局 Loading 效果

前言今天在做 react 后台管理的时候要实现一个全局 Loading 效果,通常使用 axios 库与后端进行数据交互。为了更好的用户体验,在每次请求前添加一个加载效果,让用户知道在等待加载。要实现这个功能,我们可以在每个组件请求手动添加…

jdk8 stream去重复_重复文件查找和清理工具

在Mac上怎样可以快速搜索和清理重复文件呢?小编建议您使用Tidy Up for Mac,是非常强大而使用简单的一款重复文件清理工具,Tidy Up 5带有简单的搜索模式,并且包括80多种预定义的智能搜索,可以快速而准确的帮助您查找重复…

《科学》杂志展望2020年十大科学头条

来源:新华网 美国《科学》杂志2日刊文展望了2020年可能成为头条的十大科学新闻,中国建造全球首台E级超算、“基因剪刀”技术发布临床试验结果等入榜。这一权威学术刊物预测,中国有望在2020年建造出世界第一台E级超算。E级超算即百亿亿次超级计…

visual2019没有勾选的在如何加入_【CAD教程】CAD软件中如何打散不可分解的块?...

你我共享,快乐学习☀想认识志同道合的朋友一起学习CAD?请加入我们的QQ群648869816CAD中打散图块可以用“分解”命令(快捷键是X)。但是如果出现定义块的“允许分解”前面没有打钩,那么这个块形成后是无法通过X分解的,如下图所示。那…

哪些动物拥有惊人的数学天赋?

来源:新浪科技猩猩、鹦鹉、蜜蜂, 甚至连老鼠都会数数,它们甚至还会计算。这种能力是动物们物竞天择的优势,例如,在觅食时的优势。动物的数学天赋已经被科学家研究过很多次了,每次结果都很有趣。知道有多少敌…

c语言中有关main的问题,c语言小问题

2008-03-13while语句void main(){int a0,n;printf("\n input n: ");scanf("%d",&n);while (n--)printf("%d ",a*2);}do-while语句void main(){int a0,n;printf("\n input n: ");scanf("%d",&n);do printf("%d …

miniui 样式第一次加载不出来_小程序设计规范及经验分享(附最新样式库)

点击上方蓝字,关注行设视觉本文已获得作者授权,发布于行设视觉,转载请注明出处。作者 | 孙青Cynthia_Sunhttps://www.zcool.com.cn/article/ZOTM4NjQ0.html2019 新版小程序控件设计规范源文件见底部说明正文最近设计群里经常有人问起小程序设…

c语言软件电脑下载文件,求C语言头文件下载?

传统 C#include <assert.h> //设定插入点#include <ctype.h> //字符处理#include <errno.h> //定义错误码#include <float.h> //浮点数处理#include <fstream.h> //文件输入&#xff0f;输出#include <iomanip.h> //参数化输入&#xff0f…

从 AlphaGo 到具有人类智慧的 AI 究竟有多远?François Chollet 有了一些新想法

图片来自Alex Castro / The Verge来源&#xff1a; AI科技评论编译&#xff1a; 龚倩编辑&#xff1a;丛末测量人工智能的「智慧」是计算机科学领域中最棘手但最重要的问题之一。如果你不明白你今天制造的机器是否比昨天更聪明&#xff0c;那你怎么知道你在进步&#xff1f;乍一…

3.17作业

3.17作业 选择你喜欢的花 1. 布局设计代码 <TextViewandroid:layout_width"wrap_content"android:layout_height"wrap_content"android:layout_gravity"center"android:text"Please choose a flower you like!"android:textSize&qu…

listctrl 优化_教育培训网站SEO优化,新的网站SEO优化整体外包费用

原标题&#xff1a;教育培训网站SEO优化&#xff0c;新的网站SEO优化整体外包费用百度营销凭借强大的用户产品优势&#xff0c;每天数十亿次搜索请求、超过1亿用户浏览百度信息流、800亿次定位服务请求&#xff0c;为客户提供全系列产品广告资源覆盖用户生活全场景。百度搜索se…

c语言楼梯有10级台阶,C语言小程序之没事爬楼梯

题目有39级台阶&#xff0c;每一步只能走1阶或者2阶。如果需要走偶数步&#xff0c;求上台阶的方案数。分析拿到题目就是一通分析&#xff0c;39是奇数&#xff0c;一次走1阶或者两阶。。。那么就有&#xff1a;1*x2y39&#xff0c;x得是个奇数。。。要求走偶数步&#xff0c;那…