CNN基础学习

现在感觉,神经网络模型成为了基本单元,或者原理图的元器件,或者积木的基本块,然后人们设计出各种类型的积木块(自己想怎么设计就怎么设计),用这些积木进行搭建,CNN呀,RNN,transformer等诞生了。

CNN 的英文全称是 Convolutional Neural Network,中文译为卷积神经网络。

CNN分成卷积层、池化层和全连接层。
卷积层:特征提取。
池化层:降维。
全连接层:输出结果。

1.组成

1.1 卷积层

功能:网络的核心,用于特征提取。
关键概念:卷积核/滤波器:一个小的权重矩阵(如3x3, 5x5)。以前把filter翻译为滤波器,现在都是翻译成卷积核。

它在输入上滑动,计算局部点积,生成特征图。一个卷积层可以有多个不同的卷积核,每个负责提取一种特征。
特征图:卷积核在输入上滑动计算后得到的输出。它反映了原图中某种特征(如垂直边缘)的分布。
步长:卷积核每次移动的像素数。步长大,输出尺寸小。

填充:在输入图像边缘补零。目的是控制输出特征图的尺寸,防止过快缩小。还有一点原因是如果不填充,通过卷积核扫描计算,它边界(上下左右)的元素被扫描的少,信息就有确实,所以就填充(padding)。注意,填充是一圈一圈的填充。

1.2 激活函数层

功能:引入非线性,使网络能够学习复杂的模式。
常用函数:ReLU。它将所有负值置零,保留正值。计算简单,能有效缓解梯度消失问题。

1.3 池化层

功能:进行空间下采样,减少参数和计算量,并增强特征的空间不变性。
常用类型:
最大池化:取窗口内的最大值。最常用,能保留最显著的特征。平均池化:取窗口内的平均值。特点:池化操作是确定性的,没有需要学习的参数。

1.4 全连接层

功能:通常出现在网络的最后几层。
它将前面卷积和池化层提取到的、在空间上展开的二维高级特征“拉直”成一维向量,并进行综合,用于最终的分类或回归输出。

注意:在现代架构(如ResNet)中,常用“全局平均池化”替代一部分全连接层,以减少过拟合。

2.超参数

卷积核超参数:步长,大小。
一个卷积核的通道数由输入的通道数决定。比如卷积核我们设置大小为mxn,输入通道为3,那么一个卷积核就是mxnx3。注意:一个卷积核生成一个特征图——啥意思呢?就比如输入3个通道,那3个通道各个通道对应一个卷积计算,做卷积计算时会有3个结果(每个通道一个),然后3个卷积结果相加就是对应特征图的一个元素。

填充几圈数。
输入通道数,
网络层数,
激活函数,
学习率,
等等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1145067.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion+智能侦测联动教程:2块钱玩转AI视觉创作

Stable Diffusion智能侦测联动教程:2块钱玩转AI视觉创作 1. 为什么你需要这个方案? 作为一名自媒体博主,你是否遇到过这些困扰: - 想用AI生成创意图片或视频,但家用电脑跑Stable Diffusion就卡死 - 好不容易生成图片…

Llama3威胁情报分析:没显卡也能跑,云端1小时1块极速体验

Llama3威胁情报分析:没显卡也能跑,云端1小时1块极速体验 1. 为什么需要AI做威胁情报分析? 最近接了个威胁情报分析的私活,客户要求用最新AI模型,但家里那台老电脑还是GTX 1060显卡,跑个小模型都卡顿。相信…

StructBERT情感分析模型应用:客服对话情绪识别

StructBERT情感分析模型应用:客服对话情绪识别 1. 中文情感分析的技术价值与应用场景 在智能客服、社交媒体监控、用户反馈分析等场景中,中文情感分析已成为自然语言处理(NLP)的核心能力之一。相比英文,中文由于缺乏…

没预算玩AI安全?按秒计费方案解救你

没预算玩AI安全?按秒计费方案解救你 对于非营利组织来说,数据安全至关重要但预算有限。本文将介绍如何利用按秒计费的AI方案,以极低成本实现专业级的安全防护能力。 1. 为什么AI安全对非营利组织很重要 非营利组织通常处理大量敏感数据&am…

毕业设计救星:AI智能体云端GPU方案,1小时1块不耽误

毕业设计救星:AI智能体云端GPU方案,1小时1块不耽误 1. 为什么你需要云端GPU方案? 作为一名大四学生,当你正在为毕业设计焦头烂额时,突然发现实验室的GPU资源被占满,自己的笔记本电脑又跑不动复杂的AI模型…

中文情感分析轻量解决方案:StructBERT部署指南

中文情感分析轻量解决方案:StructBERT部署指南 1. 背景与需求:为什么需要轻量级中文情感分析? 在当前自然语言处理(NLP)广泛应用的背景下,中文情感分析已成为智能客服、舆情监控、用户评论挖掘等场景中的…

导师不会说的7款AI神器:1天生成3万字计算机论文,真实文献揭秘!

90%的学生还在为开题和文献综述熬夜秃头,而你的同门可能已经用上了导师圈里秘而不宣的“核武器”。你以为他们熬夜是努力,其实他们只是在等AI跑完数据。 当你在深夜对着空白的Word文档抓狂,对着导师的修改意见一头雾水,甚至为凑不…

GTE中文语义相似度计算一文详解:高维向量转换技术

GTE中文语义相似度计算一文详解:高维向量转换技术 1. 引言:GTE 中文语义相似度服务 在自然语言处理(NLP)领域,语义相似度计算是理解文本间深层关系的核心任务之一。传统基于关键词匹配或编辑距离的方法难以捕捉句子间…

GTE中文语义相似度计算优化实战:提升准确率方法

GTE中文语义相似度计算优化实战:提升准确率方法 1. 引言:GTE 中文语义相似度服务的工程价值 在自然语言处理(NLP)的实际应用中,语义相似度计算是智能客服、文本去重、推荐系统和问答匹配等场景的核心技术。传统的关键…

GTE中文语义相似度计算案例:智能问答系统构建

GTE中文语义相似度计算案例:智能问答系统构建 1. 引言:GTE 中文语义相似度服务的价值与应用场景 在智能问答、对话系统和信息检索等自然语言处理任务中,判断两段文本是否具有相似语义是核心基础能力之一。传统的关键词匹配方法难以捕捉深层…

中文情感分析模型测试:A/B测试方法论

中文情感分析模型测试:A/B测试方法论 1. 引言:中文情感分析的现实挑战与技术需求 在社交媒体、电商评论、客服对话等场景中,用户生成的中文文本蕴含着丰富的情感信息。如何高效、准确地识别这些文本的情绪倾向(正面或负面&#…

StructBERT API性能测试:并发处理能力详解

StructBERT API性能测试:并发处理能力详解 1. 背景与应用场景 在当前自然语言处理(NLP)的实际落地中,情感分析已成为客服系统、舆情监控、用户反馈挖掘等场景的核心技术之一。中文作为语义结构复杂、表达灵活的语言,…

GTE中文语义相似度计算部署教程:修复输入数据格式问题详解

GTE中文语义相似度计算部署教程:修复输入数据格式问题详解 1. 引言 随着自然语言处理技术的不断演进,语义相似度计算已成为智能客服、推荐系统、文本去重等场景的核心能力。在中文领域,达摩院推出的 GTE(General Text Embedding…

避坑!智能侦测环境配置Top5错误,用预置镜像全避开

避坑!智能侦测环境配置Top5错误,用预置镜像全避开 引言:环境配置的痛,我们都懂 刚接手新项目时,我最怕看到"请先配置开发环境"这句话。记得有次在公司服务器上配PyTorch环境,CUDA版本不兼容、依…

毕业设计救星:AI侦测+云端GPU,三天搞定算法原型

毕业设计救星:AI侦测云端GPU,三天搞定算法原型 1. 为什么你需要云端GPU救急? 作为一名大四学生,当你的毕业设计需要用到行人检测算法时,突然发现实验室GPU资源排队到下周,而自己的笔记本跑一帧图像要10分…

中文情感分析模型对比:StructBERT vs 传统方法

中文情感分析模型对比:StructBERT vs 传统方法 1. 引言:中文情感分析的技术演进与选型挑战 随着社交媒体、电商平台和用户评论系统的普及,中文情感分析已成为自然语言处理(NLP)中最具实用价值的场景之一。其核心任务…

StructBERT实战教程:构建舆情监控情感分析模块

StructBERT实战教程:构建舆情监控情感分析模块 1. 引言 1.1 中文情感分析的现实需求 在社交媒体、电商平台和用户反馈系统中,海量中文文本数据每天都在产生。如何从这些非结构化语料中快速识别公众情绪倾向,已成为企业舆情监控、品牌管理与…

中文文本情感分析教程:StructBERT模型详解

中文文本情感分析教程:StructBERT模型详解 1. 引言:中文情感分析的重要性与挑战 在当今信息爆炸的时代,中文互联网每天产生海量的用户评论、社交媒体内容和产品反馈。如何从这些非结构化文本中快速提取情绪倾向,成为企业舆情监控…

中文文本情感分析部署指南:StructBERT轻量CPU版详细步骤

中文文本情感分析部署指南:StructBERT轻量CPU版详细步骤 1. 背景与应用场景 1.1 中文情感分析的重要性 在当今信息爆炸的时代,用户每天在社交媒体、电商平台、客服系统中产生海量的中文文本数据。如何从这些非结构化文本中快速提取情绪倾向&#xff0…

Spring Boot Starter OpenTelemetry_微服务分布式追踪的实现与应用

1. 引言 1.1 OpenTelemetry 简介 可观测性标准:OpenTelemetry 是 CNCF 的可观测性标准项目,提供统一的遥测数据收集和处理框架 多语言支持:支持 Java、Go、Python、JavaScript 等多种编程语言 厂商中立:与供应商无关的开放标准 1.2 分布式追踪的重要性 微服务可见性:在复…