sklearn与经典机器学习算法
- 机器学习的利器——sklearn
- 机器学习的7个流程:
- sklearn的功能主要分为六大部分:
目标:
1、掌握sklearn的基本用法
2、掌握线性回归的原理,并进行实践操作
3、理解监督学习经典算法、如K-近邻算法
4、理解非监督学习经典算法
机器学习的利器——sklearn
机器学习的7个流程:
1、数据处理
2、分割数据
3、训练模型
4、验证模型
5、测试模型
6、使用模型
7、调优模型
数据处理:从磁盘中读取数据,并对数据进行预处理(如归一化、标准化、正则化、属性缩放、特征编码、插补缺失值、生成多项式特征等。
分割数据:将数据随机分割成三组:训练集、验证集(有时为可选项)、测试集
训练模型:针对选取好的特征,使用训练数据来构建模型,即拟合数据,寻找最优的模型参数。
(这里的拟合数据,主要是指使用各种机器学习