深度学习今年来经典模型优缺点总结,包括卷积、循环卷积、Transformer、LSTM、GANs等

文章目录

  • 1、卷积神经网络(Convolutional Neural Networks,CNN)
    • 1.1 优点
    • 1.2 缺点
    • 1.3 应用场景
    • 1.4 网络图
  • 2、循环神经网络(Recurrent Neural Networks,RNNs)
    • 2.1 优点
    • 2.2 缺点
    • 2.3 应用场景
    • 2.4 网络图
  • 3、长短时记忆网络(Long Short-Term Memory,LSTM)
    • 3.1 优点
    • 3.2 缺点
    • 3.3 应用场景
    • 3.4 网络图
  • 4、门控循环单元(Gated Recurrent Unit,GRU)
    • 4.1 优点
    • 4.2 缺点
    • 4.3 应用场景
    • 4.4 网络图
  • 5、自注意力模型(Transformer)
    • 5.1 优点
    • 5.2 缺点
    • 5.3 应用场景
    • 5.4 网络图
  • 6、生成对抗网络(Generative Adversarial Networks,GANs)
    • 6.1 优点
    • 6.2 缺点
    • 6.3 应用场景
    • 6.4 网络图

1、卷积神经网络(Convolutional Neural Networks,CNN)

1.1 优点

  • 可用于图像处理和计算机视觉领域任务,包括图像分类、人物检索、物体重识别、物体检测和图像分割。
  • 通过卷积层有效捕捉图像中的局部特征(这是跟 transformer 的区别,transformer 关注全局信息)。
  • 具有平移不变性。

1.2 缺点

  • 需要大规模的标记图像数据进行训练。
  • 在其他领域的任务上性能可能不如前馈神经网络。

1.3 应用场景

适用场景:图像分类、目标检测等。
案例:图像识别。将图像分类为不同的物体或场景。

1.4 网络图

《Gradient-based learning applied to document recognition》;LeNet-5
在这里插入图片描述

2、循环神经网络(Recurrent Neural Networks,RNNs)

2.1 优点

  • 适用于序列数据,如自然语言处理和时间序列分析。
  • 具有循环连接,可以处理不定长的序列数据。
  • 具有记忆能力,可以捕捉时间依赖性。

2.2 缺点

  • 梯度消失问题,导致长序列的性能下降。
  • 计算复杂性较高,不适用于大规模数据和深度网络。

2.3 应用场景

适用场景:序列建模、自然语言处理等。
案例:语音识别。将口头语言转换为文本。

2.4 网络图

《Recurrent Neural Networks》
在这里插入图片描述

3、长短时记忆网络(Long Short-Term Memory,LSTM)

3.1 优点

  • 解决了RNN的梯度消失问题。
  • 适用于长序列的建模。
  • 在自然语言处理等领域取得了显著的成功。

3.2 缺点

  • 计算复杂性较高。
  • 需要大量的数据来训练深层 LSTM 网络。

3.3 应用场景

适用场景:处理长序列和时间序列数据。
案例:股票价格预测。预测金融市场的趋势。

3.4 网络图

《Long Short-Term Memory networks》
在这里插入图片描述

4、门控循环单元(Gated Recurrent Unit,GRU)

4.1 优点

  • 类似于 LSTM,但参数较少,计算复杂性较低。
  • 在某些任务上性能与 LSTM 相媲美。

4.2 缺点

  • 对于某些复杂任务,性能可能不如LSTM。

4.3 应用场景

适用场景:用于序列数据处理,与 LSTM 类似。
案例:情感分析。分析文本中的情感。

4.4 网络图

在这里插入图片描述

5、自注意力模型(Transformer)

5.1 优点

  • 适用于自然语言处理和序列建模等任务。
  • 可并行化,计算效率高。
  • 在大规模数据和深度模型上表现出色。

5.2 缺点

  • 需要大规模的数据来训练。
  • 相对较新的模型,可能不适用于所有任务。

5.3 应用场景

适用场景:用于自然语言处理、机器翻译等。
案例:机器翻译。将一种语言的文本翻译为另一种语言。

5.4 网络图

《Attention is All you need》
在这里插入图片描述

6、生成对抗网络(Generative Adversarial Networks,GANs)

6.1 优点

  • 用于生成数据和图像,以及进行无监督学习。
  • 生成高质量的样本。
  • 在图像生成、风格迁移等领域取得了显著的成功。

6.2 缺点

  • 训练复杂性高,稳定性差,需要谨慎调整超参数。
  • 对于某些任务,可能存在模式崩溃问题。
  • 相较于最新的扩散模型,生成的质量和效果不具有竞争性,特定的生成数据可能存在一定的噪声。

6.3 应用场景

适用场景:用于生成图像、音频、文本等。
案例:图像生成。生成逼真的图像。

6.4 网络图

《Generative Adversarial Nets》
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/187907.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

L1-010:比较大小

题目描述 本题要求将输入的任意3个整数从小到大输出。 输入格式: 输入在一行中给出3个整数&#xff0c;其间以空格分隔。 输出格式: 在一行中将3个整数从小到大输出&#xff0c;其间以“->”相连。 输入样例: 4 2 8输出样例: 2->4->8 程序代码 #include<stdio.h&…

基于YOLOv8深度学习的安全帽目标检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战

《博主简介》 小伙伴们好&#xff0c;我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源&#xff0c;可关注公-仲-hao:【阿旭算法与机器学习】&#xff0c;共同学习交流~ &#x1f44d;感谢小伙伴们点赞、关注&#xff01; 《------往期经典推…

Git——使用Git进行程序开发

主要介绍个人开发提交记录的主要流程&#xff0c;包括以下内容&#xff1a; 索引- 提交的暂存区。查看工作的状态和内部变更。如何读取用于描述变更的已扩展统一diff格式。支持查询和交互的提交&#xff0c;修改提交。创建、显示和选择&#xff08;切换&#xff09;分支。切换…

面试:如何故意减慢网站速度?

面试问题&#xff1a;假设你为你的客户建立了一个网站。但他没有定期支付费用。现在你想放慢他的网站速度&#xff0c;但又不想让他立即发现。你会怎么做&#xff1f; 我&#xff1a;用较慢的算法和其他与编码相关的选项替换代码中使用的算法。 面试问题&#xff1a;问在这种情…

婴儿专用洗衣机有必要买吗?宝宝洗衣机洗衣服

我们都知道刚出生的宝宝抵抗力较弱&#xff0c;很容易因为细菌感染然后生病&#xff0c;宝宝接触最多的就是衣服&#xff0c;我们在手洗的过程很难把衣服上的细菌清洗掉&#xff0c;而使用我们传统的洗衣机很容易造成细菌的第二次感染&#xff0c;很容易将宝宝的抵抗力弄得越来…

如何通过linux调用企业微信发送告警消息

一、前期准备 1、企业微信具备管理企业权限。 2、服务器有公网IP或者可以将本机端口通过net映射到公网。 二、通过脚本向企业微信发送消息 1、创建sh脚本用来发送消息。 vim 2.sh 注意&#xff1a;脚本中xxxx信息需要在企业微信管理后台获取。 #!/bin/bash # 设置企业…

2023年计网408

第33题 33.在下图所示的分组交换网络中&#xff0c;主机H1和H2通过路由器互连&#xff0c;2段链路的带宽均为100Mbps、 时延带宽积(即单向传播时延带宽)均为1000bits。若 H1向 H2发送1个大小为 1MB的文件&#xff0c;分组长度为1000B&#xff0c;则从H1开始发送时刻起到H2收到…

MySQL 学习笔记(刷题篇)

SQL进阶挑战 聚合分组查询 SQL123 select tag, difficulty, round((sum(score) - max(score) - min(score) ) / (count(score) - 2) ,1) as clip_avg_score from examination_info as ei, exam_record as er where ei.exam_id er.exam_id and ei.tag SQL and ei.diffi…

代码随想录刷题题Day2

刷题的第二天&#xff0c;希望自己能够不断坚持下去&#xff0c;迎来蜕变。&#x1f600;&#x1f600;&#x1f600; 刷题语言&#xff1a;C / Python Day2 任务 977.有序数组的平方 209.长度最小的子数组 59.螺旋矩阵 II 1 有序数组的平方&#xff08;重点&#xff1a;双指针…

将项目放到gitee上

参考 将IDEA中的项目上传到Gitee仓库中_哔哩哔哩_bilibili 如果cmd运行ssh不行的话&#xff0c;要换成git bash 如果初始化后的命令用不了&#xff0c;直接用idea项放右键&#xff0c;用git工具操作

XXL-Job详解(二):安装部署

目录 前言环境下载项目调度中心部署执行器部署 前言 看该文章之前&#xff0c;最好看一下之前的文章&#xff0c;比较方便我们理解 XXL-Job详解&#xff08;一&#xff09;&#xff1a;组件架构 环境 Maven3 Jdk1.8 Mysql5.7 下载项目 源码仓库地址链接: https://github.…

前端对浏览器的理解

浏览器的主要构成 用户界面 &#xff0d; 包括地址栏、后退/前进按钮、书签目录等&#xff0c;也就是你所看到的除了用来显示你所请求页面的主窗口之外的其他部分。 浏览器引擎 &#xff0d; 用来查询及操作渲染引擎的接口。 渲染引擎 &#xff0d; 用来显示请求的内容&#…

中国丙烯基弹性体PBE市场调研与预测报告(2023版)

内容简介&#xff1a; 丙烯基弹性体&#xff08;PBE&#xff09;是以丙烯为主要原料&#xff0c;加入少量乙烯&#xff08;或α-烯烃&#xff09;单体经溶液聚合而得到的以无定形区域为主的低结晶聚合物。与传统的乙丙橡胶不同&#xff0c;PBE的乙烯含量通常低于20%&#xff0…

某60区块链安全之薅羊毛攻击实战一学习记录

区块链安全 文章目录 区块链安全薅羊毛攻击实战一实验目的实验环境实验工具实验原理实验内容薅羊毛攻击实战一 实验步骤EXP利用 薅羊毛攻击实战一 实验目的 学会使用python3的web3模块 学会分析以太坊智能合约薅羊毛攻击漏洞 找到合约漏洞进行分析并形成利用 实验环境 Ubun…

JVM类加载与运行时数据区

目录 一、类加载器 jvm类的加载过程 第一阶段&#xff1a;加载 第二阶段&#xff1a;链接阶段 第三阶段&#xff1a;初始化阶段&#xff1a; 双亲委派机制 沙箱安全机制 运行时数据区 栈-Xss1m 堆 TLAB 逃逸分析 方法区 常量池中有什么 StringTable为什么要调整位…

c# statusStrip 显示电脑主机名、IP地址、MAC地址

控件&#xff1a; ToolStripStatusLabel 主机名&#xff1a; Dns.GetHostName() IP地址&#xff1a; Dns.GetHostAddresses(Dns.GetHostName())[0].ToString() 当前程序的版本&#xff1a; Assembly.GetExecutingAssembly().GetName().Version.ToString() 获取系统版本 …

VS Code C++可视化调试配置Natvis,查看Qt、STL变量内容

VS Code C可视化调试配置Natvis 使用GlobalVisualizersDirectory Windows下 C:\Users\YourName\.vscode\extensions\ms-vscode.cpptools-1.18.5-win32-x64\debugAdapters\vsdbg\bin\Visualizers\Linux下 ~\.vscode\extensions\ms-vscode.cpptools-1.18.5-win32-x64\debugAd…

Spring Cloud 原理(第一节)

一、百度百科 Spring Cloud是一系列框架的有序集合。它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发&#xff0c;如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等&#xff0c;都可以用Spring Boot的开发风格做到一键启动和部署。Spri…

播放器开发(六):音频帧处理并用SDL播放

目录 学习课题&#xff1a;逐步构建开发播放器【QT5 FFmpeg6 SDL2】 步骤 AudioOutPut模块 1、初始化【分配缓存、读取信息】 2、开始线程工作【从队列读帧->重采样->SDL回调->写入音频播放数据->SDL进行播放】 主要代码 分配缓存 // 对于样本队列 av_audio_…

实验五 C语言函数程序设计习题 (使用函数计算两点间的距离,请编写函数fun,使用函数输出字符矩阵,使用函数求最大公约数和最小公倍数)

1. 使用函数计算两点间的距离&#xff1a;给定平面任意两点坐标(x1,y1)和(x2,y2)&#xff0c;求这两点之间的距离(保留2位)小数。要求定义和调用dist(x1,y1,x2,y2)计算两点间的距离。坐标中两点坐标之间的距离公式如下&#xff1a; #include <stdio.h> #include <math…