1.基于模型的学习
根据以往的学习经验,建立起输入输出的模型,然后预测输入,并且将输入带入到模型中,进而预测出输出的结果,这种学习称为基于模型的学习
2.机器学习的过程
1)数据收集:通过爬虫、设备采集等方式进行数据的采集
2)数据清洗:对数据进行规范化,误差大、无意义的数据我们得删除
3)选择模型:建立解决问题的算法
4)训练模型:将建立的模型进行训练,使其达到最优
5)模型评估:对模型进行验证
6)测试模型:在测试环境下对模型进行测试验证
7)应用模型
8)模型维护
3.机器学习的基本问题
1)回归问题:根据某种性能最佳的模型,将未知的输入输出带入模型,得到连续的输出
2)分类问题:同上,得到离散的输出
3)聚类问题
4.机器学习的核心问题
1)建模问题:根据已知条件得到模型,如根据离散点得到y=x
2)评估问题:损失函数=预测值-真实值,将损失函数(loss function)优化到最小,则说明预测值最接近真实值;
①均方差=真实值与预测值的差的平方和再处于真实值的个数,均方差E即为损失函数,对其求导,当导数为0时,即得到损失函数取得函数极值时自变量的值
②交叉熵
3)优化问题:通过对数据的反复锤炼,梯度下降法
loss function = f(x,y)
5.线性回归
1)概念:一种通过已知自变量和因变量的关系,创建一个最优的线性关系模型,如下图,求出w0、w1,函数,随机给一个未知的x,就可以求出对应的f(x)值
2)思想:创建模型,找到最优的参数,而得到最优参数的方法,有迭代法和梯度下山法
以下是一个做线性回归的代码示例
样本:
代码: