卷积神经网络(知识点)

一、为了使特征图变小:

由两种方法:1.增大步长:卷积的时候不是一次一步,而是一次多步,类似一张图片,在原来的像素基础上,每隔一个取一个像素点。

其中S就是步长

注意:扩大步长不经常用,因为会丢失信息,而且还会引入计算

                      2.池化:1)平均池化

                                    2)最大池化

二、卷积的过程中,希望通道数增加,而特征图大小减小 

  1. 增强特征表达能力:通过增加通道数,每个卷积层能够学习更多种类的特征。初始层通常识别基本的边缘、颜色和纹理等低级特征,而随着层数加深,网络能够捕捉更加复杂的模式和高层次语义信息。更多的通道意味着网络可以同时处理并整合更丰富的特征表示。

  2. 减少计算复杂度和参数数量:虽然增加通道数增加了模型的容量,但减小特征图的大小有助于控制计算成本和内存使用。这主要是通过池化层(如最大池化)或步长大于1的卷积实现的。减小特征图尺寸可以显著降低后续层的计算负担,因为它们需要处理的数据点变少了。

  3. 空间不变性:通过下采样(例如,利用池化操作),网络可以获得一定程度的空间不变性,这意味着它对输入图像中的微小平移变得更加鲁棒。这对于许多视觉任务来说是非常重要的,因为它允许模型专注于最重要的特征,而不是被不相关的小变化所干扰。

  4. 有效捕获全局信息:随着特征图尺寸的减小,较高层的神经元具有更大的感受野,从而能够覆盖原始输入图像的更大区域。这意味着这些层可以捕获到更全局的信息,有助于理解场景的整体结构和上下文关系。

三、归一化和Dropout

归一化就是不同的样本,同一属性才会相对比较,不会受量纲的影响

Dropout是一种用于防止神经网络过拟合的技术。在在每一轮训练过程中,Dropout通过随机“丢弃”一部分神经元(即设置这些神经元的输出为零),从而强制网络学习更鲁棒的特征表示。这样做可以避免模型过于依赖某些特定的神经元,促使模型学习到更加泛化的特征。

三个基本卷积神经网络模型

AlexNet

AlexNet是由Alex Krizhevsky等人提出的,在2012年的ImageNet图像识别挑战赛中大放异彩,标志着深度学习时代的开始。

  • 创新点
    • 使用ReLU(Rectified Linear Unit)激活函数代替传统的tanh或sigmoid函数,加快了训练速度。
    • 引入了Dropout技术来减少过拟合。
    • 利用数据增强技术提高模型的泛化能力。
    • 使用GPU进行加速训练,解决了大规模数据和复杂模型带来的计算问题。
    • 采用了局部响应归一化(Local Response Normalization, LRN),虽然后续研究表明这一步并非必不可少。

VGG

VGG是由牛津大学视觉几何组(Visual Geometry Group)开发的一系列深度卷积神经网络架构。

  • 创新点
    • 简洁的网络结构:所有卷积层都使用3x3的小卷积核,并且步长为1,填充为1;池化层则采用2x2窗口,步长为2。这种设计让网络可以更深,同时保持参数量相对较小。
    • 深度增加:VGG通过堆叠多个这样的层,构建出了比以往任何网络都要深的架构(如VGG-16和VGG-19),证明了网络深度对于性能的重要性。
    • 标准化配置:由于其简单而一致的架构,VGG成为了许多研究的基础模型,便于比较不同方法的效果。

ResNeXt

ResNeXt是在ResNet基础上进一步发展的模型,它引入了“分组卷积”的概念,旨在以更少的参数实现更高的准确率。

  • 创新点
    • 分组卷积(Cardinality):这是ResNeXt的关键创新之一,通过将输入通道分成若干组,每组独立进行卷积操作,然后再合并结果。这种方式可以在不显著增加计算成本的情况下增加网络的表现力。
    • 合并与残差连接:所有组的输出会被拼接在一起,再经过另一个1x1的卷积层来恢复通道数,最后加上原始输入(残差连接),得到最终的输出。

    • 统一的设计原则:ResNeXt提出了一个统一的架构设计理念,即每个残差块内的变换可以用三个参数描述:宽度(滤波器的数量)、深度(网络的层数)和基数(分组卷积中的组数)。这种设计简化了超参数的选择过程。
    • 增强的表达能力:与相同参数量的传统网络相比,ResNeXt能够提供更强的特征表示能力,尤其适合处理复杂的视觉任务

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73589.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

考研系列-408真题计算机网络篇(18-23)

写在前面 此文章是本人在备考过程中408真题计算机网络部分(2018年-2023年)的易错题及相应的知识点整理,后期复习也常常用到,对于知识提炼归纳理解起到了很大的作用,分享出来希望帮助到大家~ # 2018 1.停止-等待协议的…

std::invoke详解

基础介绍 c17版本引入了std::invoke特性,这是一个通用的调用包装器,可以统一调用: 普通函数成员函数函数对象Lambda表达式指向成员的指针 它的主要作用是提供一个统一的方式来调用各种可调用对象。 std::invoke依赖的头文件:#…

使用 PaddleNLP 在 CPU(支持 AVX 指令)下跑通 llama2-7b或DeepSeek-r1:1.5b 模型(完成度80%)

原文:🚣‍♂️ 使用 PaddleNLP 在 CPU(支持 AVX 指令)下跑通 llama2-7b 模型 🚣 — PaddleNLP 文档 使用 PaddleNLP 在 CPU(支持 AVX 指令)下跑通 llama2-7b 模型 🚣 PaddleNLP 在支持 AVX 指令的 CPU 上对 llama 系列模型进行了…

Kotlin高效实现 Android ViewPager2 顶部导航:动态配置与性能优化指南

高效实现:强调代码的性能优化。Android ViewPager2:明确技术栈。顶部导航:核心功能点。动态配置与性能优化指南:突出动态配置的灵活性和性能优化的重点。 在 Android 开发中,使用 ViewPager2 实现高效的顶部导航&…

六种最新优化算法(TOC、MSO、AE、DOA、GOA、OX)求解多个无人机协同路径规划(可以自定义无人机数量及起始点),MATLAB代码

一、算法简介 (一)阿尔法进化(Alpha Evolution,AE)算法 阿尔法进化(Alpha Evolution,AE)算法是2024年提出的一种新型进化算法,其核心在于通过自适应基向量和随机步长的…

上传本地项目到GitHub

一、在GitHub上创建仓库 1.点击右上角头像–>点击Your repositories 2.点击New 3.创建仓库 网址复制一下,在后面git上传时会用到 二、打开Git Bash 1.cd 进入项目所在路径 2.输入git init 在当前项目的目录中生成本地的git管理(当前目录下出现.…

14.使用各种读写包操作 Excel 文件:辅助模块

一 各种读写包 这些是 pandas 在底层使用的各种读写包。无须安装 pandas,直接使用这些读写包就能够读写 Excel 工作簿。可以尽可能地使用 pandas 来解决这类问题,只在 pandas 没有提供你所需要的功能时才用到读写包。 表中没有 xlwings ,因为…

ubuntu ollama+dify实践

安装ollama 官网的指令太慢了,使用以下指令加速: export OLLAMA_MIRROR"https://ghproxy.cn/https://github.com/ollama/ollama/releases/latest/download" curl -fsSL https://ollama.com/install.sh | sed "s|https://ollama.com/dow…

spring boot+mybaits多条件模糊查询和分页查询

我们首先写一下多条件的模糊查询,首先在controller里面写一个接口,进行传参,我们这里要注意,之前写修改和增加的时候用的注解都是RequestBody,也就是说!前端传过来一个json,数组也行,然后我们后…

HarmonyOS NEXT - 电商App实例四(登录界面)

登录界面是用户进入App的第一步,因此需要简洁明了,同时保持品牌风格的一致性。如:顶部区域为品牌LOGO展示,增加品牌识别度;中间区域为登录表单,包含输入框和按钮;底部区域为其他登录方式、注册入…

探索ima.copilot:个人知识库搭建的AI新利器

在信息爆炸的时代,知识的积累与管理成为了个人发展的关键。面对海量的科研文献、工作资料和各类信息,如何高效地构建属于自己的知识体系,是许多人面临的挑战。ima.copilot这款AI工具的出现,为解决这一难题提供了新的思路。它凭借强…

图解多头注意力机制:维度变化一镜到底

目录 一、多头注意力机制概述二、代码实现1. pyTorch 实现2. tensorFlow实现 三、维度变化全流程详解1. 参数设定2. 维度变化流程图3. 关键步骤维度变化 四、关键实现细节解析1. 多头拆分与合并2. 注意力分数计算3. 掩码处理技巧 五、完整运行示例六、总结与常见问题1. 核心优势…

Interview preparation.md

Vue 1.1 响应式系统 Vue 3 使用 Proxy 代替 Vue 2 中的 Object.defineProperty 来实现响应式系统。Proxy 可以监听对象的所有操作,包括属性的添加和删除,从而解决了 Vue 2 的一些局限性。 Vue 2:使用 Vue.set 添加响应式属性 new Vue({el…

2.8滑动窗口专题:最小覆盖子串

1. 题目链接 LeetCode 76. 最小覆盖子串 2. 题目描述 给定字符串 s 和 t,要求找到 s 中最小的窗口,使得该窗口包含 t 的所有字符(包括出现次数)。若不存在,返回空字符串。 示例: 输入:s &quo…

【数据分析大屏】基于Django+Vue汽车销售数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅

目录 一、项目背景 二、项目创新点 三、项目功能 四、开发技术介绍 五、项目功能展示 六、权威视频链接 一、项目背景 汽车行业数字化转型加速,销售数据多维分析需求激增。本项目针对传统报表系统交互性弱、实时性差等痛点,基于DjangoVue架构构建…

cyberstrikelab lab2

lab2 重生之我是渗透测试工程师,被公司派遣去测试某网络的安全性。你的目标是成功获取所有服务器的权限,以评估网络安全状况。 先扫一下 ​ ​ 192.168.10.10 ​ ​ 骑士cms 先找后台路径 http://192.168.10.10:808/index.php?madmin&cind…

在 Ubuntu 服务器上使用宝塔面板搭建博客

📌 介绍 在本教程中,我们将介绍如何在 Ubuntu 服务器 上安装 宝塔面板,并使用 Nginx PHP MySQL 搭建一个博客(如 WordPress)。 主要步骤包括: 安装宝塔面板配置 Nginx PHP MySQL绑定域名与 SSL 证书…

PTA7-13 统计工龄

题目描述 给定公司 n 名员工的工龄,要求按工龄增序输出每个工龄段有多少员工。 输入格式: 输入首先给出正整数 n(≤105),即员工总人数;随后给出 n 个整数,即每个员工的工龄,范围在 [0, 50]。…

【 <一> 炼丹初探:JavaWeb 的起源与基础】之 Servlet 3.0 新特性:异步处理与注解配置

<前文回顾> 点击此处查看 合集 https://blog.csdn.net/foyodesigner/category_12907601.html?fromshareblogcolumn&sharetypeblogcolumn&sharerId12907601&sharereferPC&sharesourceFoyoDesigner&sharefromfrom_link <今日更新> 一、Servle…

电子电气架构 --- 汽车电子硬件架构

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 人生是一场骗局,最大的任务根本不是什么买车买房,也不是及时行乐,这就是欲望,不是理想,是把自己对生命的希望寄托在外物上,正确的做法应该是内…