第十九章 神经网络模型:从生物机理到智能分类
引言
人工神经网络(Artificial Neural Network, 简称 ANN)是人工智能领域的重要基石。它并非对生物大脑的简单复制,而是在现代神经科学研究基础上提出的一种抽象数学模型。自 1943 年心理学家 W. McCulloch 和数学家 W. Pitts 提出形式神经元的 MP 模型以来,神经网络经历了半个多世纪的曲折发展。特别是 20 世纪 80 年代,随着反向传播(Back-Propagation, BP)算法的成熟,神经网络克服了长期以来的训练难题,迎来了研究的爆发期。
如今,神经网络已发展成为一门介于物理学、数学、计算机科学和神经生物学之间的交叉学科。它在模式识别、图像处理、智能控制、组合优化、金融预测及专家系统等领域展现出强大的生命力。本章将重点讨论神经网络的基本单元、拓扑结构、核心学习算法(BP 算法与 LVQ 算法),并通过经典的 “蠓虫分类问题” 展示其在模式识别中的具体应用。
§1 神经网络基础:模型与结构
1.1 人工神经元模型
神经元是神经网络的基本处理单元。一个标准的人工神经元模型通常包含三个基本要素:连接权值、求和单元和激活函数。
1. 数学表达设神经元 k 接收 p 个输入信号 x1,x2,…,xp,对应的连接权值为 wk1,wk2,…,wkp。神经元内部首先对输入进行线性加权求和,得到净输入 uk:uk=∑j=1pwkjxj随后,引入一个阈值(Threshold)θk(或偏置 bk=−θk),并通过一个非线性激活函数 ϕ(⋅) 产生输出 yk:yk=ϕ(uk−θk)=ϕ