网站程序制作可以做外链的视频网站
web/
2025/10/1 0:36:04/
文章来源:
网站程序制作,可以做外链的视频网站,小程序开发模板源码,如何自己做公司网页当我学习到这个知识点的时候十分困惑#xff0c;因为从名字中我完全无法理解这个什么东西。于是呢我就去问了一下维基百科#xff0c;下面是他的回答#xff1a; 特征工程#xff08;英语#xff1a;feature engineering#xff09;又称特征提取#xff08;英语#xf… 当我学习到这个知识点的时候十分困惑因为从名字中我完全无法理解这个什么东西。于是呢我就去问了一下维基百科下面是他的回答 特征工程英语feature engineering又称特征提取英语feature extraction或特征发现英语feature discovery是使用领域知识从原始数据中提取特征特征、属性、特性的过程。 与仅向机器学习提供原始数据相比其动机是使用这些额外的功能来提高机器学习过程的结果质量。 说实话当我看完段文字后我心情是复杂的因为我觉得这不但没有解决我原有的困惑反而更加迷糊了。如果你和我有一样的困扰那么我试试用通俗点的语言和一些小例子来让我们一起理解什么是特征工程。
一、什么是特征 要理解特征工程必须先知道什么是特征。在我之前的文章中我详细的介绍过什么是特征你可以去瞧瞧看在这里我简单用几个例子给大家说明。 【机器学习300问】6、什么是机器学习中的特征量http://t.csdnimg.cn/WKohN
例一一个人有两只手、两只腿、一个头、能使用工具、会奔跑。在这句话中这些用来描述人的词语就是特征。
例二一套房子的信息中有房屋宽度、房屋深度、房间数量、楼层数量、地理位置、房屋年限。这些用来描述房子的词语就是特征。 把上述的例子用一个二维表格来表示的话就可以画成这样
房屋特征表 房屋宽度房屋深度房间数量楼层数量地理位置房屋年限房1101041市中心10房281241市中心5房39931郊区2 特征就是这样的表格中的每一列一列就是一个特征
二、什么是特征工程 上面的这个表中有很多列这些原本就在表中的列我们叫他原始数据或者叫他原始特征。特征工程其中的“工程”两个字就是说要对这个特征做写什么操作。那么做什么操作呢做这些操作的目的是什么呢如果搞懂了这两个问题那么你就真正了解了什么是特征工程。
1特征工程要处理的数据常见的形式
结构化数据结构化数据类型可以看做关系型数据库的一张表就像上面这张表每一列都有很清晰的定义包含了数值型、类别型两种基本类型。每一行数据表示一个样本信息。非结构化数据非结构化数据主要包括文本、图像、音频、视频数据其中包含的信息无法用一个简单的数值表示也没有清晰的类别定义并且每一条数据的大小各不相同。
2特征工程具体要做哪些操作 数据清洗去除无效、缺失、重复的数据处理异常值填充缺失值等。 特征选择确定哪些特征对模型预测目标变量最有价值剔除冗余、无关或者噪声特征。 特征构造基于领域知识或数据分析结果创建新的特征例如在上面表中我们只知道房屋的宽度和深度两个特征但如果我想预测房屋的房价那么面积 宽度 * 深度就更贴合我需要分析的问题。“面积”这个特征就是我构造出来的。 特征缩放对特征进行归一化或标准化处理确保不同尺度的特征在模型训练中具备可比性。 特征组合将多个特征通过数学运算如乘法、加法、逻辑运算等组合成更高阶的特征。
3特征工程的目的是什么 特征工程是从原始数据中提取、转换、构建具有代表性和预测能力的新特征的过程。特征工程的主要目的是提取出对预测模型有用的信息这些信息以特征的形式表现出来。特征在机器学习模型中被用来预测或分类数据因此它们必须包含足够的有用信息以帮助模型做出准确的预测或分类。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/84742.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!