神经网络是如何工作的

人工智能最核心的技术之一,就是神经网络(Neural Networks)。但很多初学者会觉得它是个黑盒:为什么神经网络能识别图片、翻译语言,甚至生成文章?

本文用图解+最小代码实现的方式,带你深入理解:神经网络的基本结构、工作流程、核心原理


🧠 一、什么是神经网络?

神经网络是一种模拟人脑神经元连接方式的算法结构。它由输入层、隐藏层和输出层构成,核心是:

输入 → 权重计算 → 激活函数 → 输出


🧩 二、图解神经网络结构

我们以最简单的三层神经网络为例(1个隐藏层):

输入层        隐藏层         输出层x1 ─┬───▶ o1 ──┬───▶ y1(预测值)x2 ─┘        o2 ──┘
  • x1、x2:输入特征(如图像像素、文本向量)
  • o1、o2:隐藏层神经元(通过加权计算+激活函数)
  • y1:输出结果(如类别概率)

⚙️ 三、神经元的工作机制

每个神经元做两件事:

  1. 加权求和

    z = w 1 ⋅ x 1 + w 2 ⋅ x 2 + b z = w_1 \cdot x_1 + w_2 \cdot x_2 + b z=w1x1+w2x2+b

  2. 激活函数(如 sigmoid):

    a = 1 1 + e − z a = \frac{1}{1 + e^{-z}} a=1+ez1

这个“激活”让网络具有非线性表达能力,能处理图像、声音等复杂数据。


🔢 四、用代码模拟一个简单神经元(Python实现)

import numpy as np# 输入数据
x = np.array([0.5, 0.3])  # 两个特征
w = np.array([0.8, -0.4]) # 权重
b = 0.1                   # 偏置# 激活函数(sigmoid)
def sigmoid(z):return 1 / (1 + np.exp(-z))# 前向传播
z = np.dot(x, w) + b
a = sigmoid(z)print(f"神经元输出值: {a:.4f}")

输出:

神经元输出值: 0.5744

说明这个神经元“激活”了——认为输入属于某一类别的概率为 57%。


🧮 五、完整神经网络的工作流程

  1. 输入数据:一张图像或一段文本的数值向量

  2. 前向传播(forward):

    • 每层神经元对输入加权、偏置、激活
  3. 计算损失函数:预测结果 vs 实际结果的误差

  4. 反向传播(backpropagation):

    • 根据误差,反向计算每个权重对误差的影响
    • 通过梯度下降算法调整权重和偏置
  5. 迭代训练:重复多轮训练,让模型逐渐学会“正确答案”


📊 六、用图表示前向传播 & 反向传播

         前向传播:从左到右[输入] → [隐藏层] → [输出]↑反向传播:从右到左

通过这种**“尝试-反馈-修正”**机制,神经网络就像学生做题不断练习,逐渐掌握模式识别的能力。


🧠 七、神经网络小项目:分类任务(手写数字识别)

from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report# 加载数据集
digits = load_digits()
X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.3, random_state=42
)# 构建一个多层感知机神经网络(MLP)
model = MLPClassifier(hidden_layer_sizes=(64,), max_iter=300)
model.fit(X_train, y_train)# 评估模型
y_pred = model.predict(X_test)
print(classification_report(y_test, y_pred))

这个简单神经网络模型能对**手写数字图片(0-9)**进行识别,准确率可达95%以上。


✅ 八、总结:神经网络怎么工作?

步骤说明
输入层接收特征数据
隐藏层处理特征并提取模式
激活函数引入非线性能力
输出层给出预测结果(分类、回归等)
损失函数衡量预测和真实值的误差
反向传播通过链式法则优化参数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/82771.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode热题100 两数之和

目录 两数之和题目解析方法一暴力求解代码 方法二哈希代码 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 🐒🐒🐒 个人主页 🥸🥸🥸 C语言 🐿️🐿️🐿…

在线服务器具体是指什么?

在线服务器主要是指一种能够随时进行网络连接、管理和操作的服务器,在线服务器是通过互联网或者是本地网络,来为企业和用户提供数据存储和网络服务的,在线服务器也可以是物理服务器或者是虚拟服务器,能够根据远程访问工具进行管理…

OSPF综合性实验

实验拓扑: 第一步:进行子网划分 172.16.0.0/17 172.16.0000 00 00.00000000 -- area1 172.16.0.1/22 -- AR1--G0/0/0 172.16.0.2/22 -- AR2--G0/0/0 172.16.0.3/22 -- AR3--G0/0/0 172.16.4.1/22 -- AR1-- Lo0 172.16.8.2/22 -- AR2-- Lo0 172.16.12.3/…

WEB前端表单及表格标签综合案例

表单标签综合案例&#xff1a; 源代码&#xff1a; <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>…

实战项目3(04)

​​​​​​目录 ​​​​​​任务场景一 【r1配置】 【sw1配置】 任务场景二 【r1配置】 【sw1配置】 【sw2配置】 任务场景一 某公司网络为了减少广播包对网络的影响&#xff0c;网络管理员对网络进行了VLAN划分&#xff0c;完成VLAN划分后&#xff0c;为了不影响VL…

tinyint(3)数据类型讲解

TINYINT(3) 是数据库中用于定义字段数据类型的一种写法&#xff0c;常见于 MySQL 等数据库系统。下面来详细了解其含义和作用&#xff1a; 数据类型本质 TINYINT 属于整数类型&#xff0c;在不同的数据库系统中&#xff0c;它所占用的存储空间和表示范围通常是固定的。以 MyS…

[原创](现代Delphi 12指南):[macOS 64bit App开发]: 如何获取自身程序的所在的目录?

[作者] 常用网名: 猪头三 出生日期: 1981.XX.XX 企鹅交流: 643439947 个人网站: 80x86汇编小站 编程生涯: 2001年~至今[共24年] 职业生涯: 22年 开发语言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、 开发工具: Visual Studio、Delphi、XCode、…

自定义prometheus exporter实现监控阿里云RDS

# 自定义 Prometheus Exporter 实现多 RDS 数据采集## 背景1. Prometheus 官网提供的 MySQL Exporter 对于 MySQL 实例只能一个进程监控一个实例&#xff0c;数据库实例很多的情况下&#xff0c;不方便管理。 2. 内部有定制化监控需求&#xff0c;RDS 默认无法实现&#xff0c;…

开放原子大赛石油软件赛道参赛经验分享

亿级以上网格油藏模型三维可视化 一、赛项背景 油藏数值模拟是油气田开发中至关重要的一环。油藏数值模拟将储层与井的数学模型离散求解&#xff0c;预测地下流体、能量等的动态变化&#xff0c;广泛应用于油田产量评估、开发方案优化等。随着计算机技术特别是并行技术的发展…

学习方法讨论——正论科举精神的内核

世界不存在绝对的善&#xff0c;可以很善&#xff0c;但很难找到绝对的善&#xff0c;总带些副作用&#xff1b;世界上也不存在绝对的恶&#xff0c;可以很恶&#xff0c;但很难找到绝对的恶&#xff0c;可以尝试举例&#xff1b; 再者&#xff0c;物极必反&#xff0c;当对一个…

网络不再神秘:如何有效利用服务器网络流量探针进行监控?

目录 一、流量探针到底是个啥&#xff1f; 二、别只是“部署了”&#xff0c;关键在“用得好” 1. 做到“最小粒度”数据采集 2. 结合时间窗口&#xff0c;构建行为基线 3. 利用标签化管理&#xff0c;提升可读性 4. 把探针输出对接安全告警系统 三、那如何部署才合理&a…

uniapp(微信小程序)>关于父子组件的样式传递问题(自定义组件样式穿透)

在父组件中给子组件添加类名,子组件的样式由父组件决定 由于"微信小程序"存在【样式隔离机制】&#xff0c;且默认设置为isolated(启用样式隔离)&#xff0c;因此这里给出以下两种解决方案&#xff1a; // 小程序编译机制 1. 当 <style scoped> 存在时&#…

基于FastAPI框架的日志模块设计

以下是一个基于FastAPI框架设计的日志模块&#xff0c;结合SQLite数据库实现增删改查功能的完整实现方案&#xff1a; 1. 项目结构 your_project/ ├── app/ │ ├── logs/ # 日志模块目录 │ │ ├── models.py # 数据库模型定义 │ │ …

面试题:C++虚函数可以是内联函数吗?

目录 1.引言 2.示例 3.总结 1.引言 为什么C的虚函数和内联函数这两个看似矛盾的特性能否共存&#xff1f;这个问题实际上触及了C编译期优化与运行时多态性之间的微妙平衡。我发现这个问题不仅是面试中的常见陷阱&#xff0c;更是理解C深层机制很好的一个点。 虚函数可以被声…

用python清除PDF文件中的水印(Adobe Acrobat 无法删除)

学校老师发的资料&#xff0c;有时候会带水印&#xff0c;有点强迫症的都想给它去掉。用Adobe Acrobat试了下&#xff0c;检测不到水印&#xff0c;无法删除&#xff01;分析发现原来这类PDF文件是用word编辑的&#xff0c;其中的水印是加在了页眉中&#xff01; 自己动手想办法…

Oracle中自定义异常内置异常嵌套异常的捕获处理

一、异常类型分类 类型说明示例内置预定义异常Oracle已命名异常&#xff08;如NO_DATA_FOUND&#xff09;查询无数据时触发内置非预定义异常未命名的Oracle错误&#xff08;需用PRAGMA EXCEPTION_INIT关联&#xff09;ORA-02290&#xff08;违反检查约束&#xff09;自定义异常…

《Flutter社交应用暗黑奥秘:模式适配与色彩的艺术》

暗黑模式已从一种新奇的功能演变为用户体验中不可或缺的一环。对于Flutter开发者而言&#xff0c;如何在社交应用中完美实现暗黑模式适配与色彩对比度优化&#xff0c;是一场充满挑战与惊喜的技术探索之旅。 暗黑模式&#xff0c;绝非仅仅是将界面颜色反转这么简单。从用户体验…

【kubernetes】通过Sealos 命令行工具一键部署k8s集群

一、前言 1、sealos安装k8s集群官网&#xff1a;K8s > Quick-start > Deploy-kubernetes | Sealos Docs 2、本文安装的k8s版本为v1.28.9 3、以下是一些基本的安装要求&#xff1a; 每个集群节点应该有不同的主机名。主机名不要带下划线。所有节点的时间需要同步。需要…

视觉-语言-动作模型:概念、进展、应用与挑战(上)

25年5月来自 Cornell 大学、香港科大和希腊 U Peloponnese 的论文“Vision-Language-Action Models: Concepts, Progress, Applications and Challenges”。 视觉-语言-动作 (VLA) 模型标志着人工智能的变革性进步&#xff0c;旨在将感知、自然语言理解和具体动作统一在一个计…

Java笔记4

第一章 static关键字 2.1 概述 以前我们定义过如下类&#xff1a; public class Student {// 成员变量public String name;public char sex; // 男 女public int age;// 无参数构造方法public Student() {}// 有参数构造方法public Student(String a) {} }我们已经知道面向…