刚学完机器学习基础,今天试着入门CNN,它主要用来处理图像。作为纯新手,第一天就想大概懂CNN为啥适合图像处理、核心有哪几层,再跟着跑个demo就行,不深究原理。之前学的全连接网络处理图像会浪费像素位置关系,参数多还容易学偏,CNN能保留位置信息、减少参数,靠局部感知和参数共享抓图像特征。它核心就三层:卷积层用小卷积核抓特征,池化层缩小尺寸减计算量,全连接层负责分类。我跟着教程用TensorFlow跑了MNIST手写数字demo,全程抄API,搭了简单网络训练后准确率约98%,比全连接网络好点。虽然都是抄代码,但也算跑通了,就是参数怎么定、Padding和Stride这些术语都不懂,先记着。明天打算看看这些术语,再调调参数试试。