潍坊网站建设小程序公司企业邮箱怎么登陆
news/
2025/10/1 16:48:39/
文章来源:
潍坊网站建设小程序,公司企业邮箱怎么登陆,工信部网站备案官网,济南专业网站优化转自#xff1a;http://blog.csdn.net/warrior_zhang/article/details/41453327
机器学习的常用方法#xff0c;主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。 监督学习#xff0c;就是人们常说的分类#xff0c;通过已有的训练样本http://blog.csdn.net/warrior_zhang/article/details/41453327
机器学习的常用方法主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。 监督学习就是人们常说的分类通过已有的训练样本即已知数据以及其对应的输出去训练得到一个最优模型这个模型属于某个函数的集合最优则表示在某个评价准则下是最佳的再利用这个模型将所有的输入映射为相应的输出对输出进行简单的判断从而实现分类的目的也就具有了对未知数据进行分类的能力。在人对事物的认识中我们从孩子开始就被大人们教授这是鸟啊、那是猪啊、那是房子啊等等。我们所见到的景物就是输入数据而大人们对这些景物的判断结果是房子还是鸟啊就是相应的输出。当我们见识多了以后脑子里就慢慢地得到了一些泛化的模型这就是训练得到的那个或者那些函数从而不需要大人在旁边指点的时候我们也能分辨的出来哪些是房子哪些是鸟。监督学习里典型的例子就是KNN、SVM。 无监督学习也有人叫非监督学习反正都差不多则是另一种研究的比较多的学习方法它与监督学习的不同之处在于我们事先没有任何训练样本而需要直接对数据进行建模。这听起来似乎有点不可思议但是在我们自身认识世界的过程中很多处都用到了无监督学习。比如我们去参观一个画展我们完全对艺术一无所知但是欣赏完多幅作品之后我们也能把它们分成不同的派别比如哪些更朦胧一点哪些更写实一些即使我们不知道什么叫做朦胧派什么叫做写实派但是至少我们能把他们分为两个类。无监督学习里典型的例子就是聚类了。聚类的目的在于把相似的东西聚在一起而我们并不关心这一类是什么。因此一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。 那么什么时候应该采用监督学习什么时候应该采用非监督学习呢 如果我们在分类的过程中有训练样本(training data)则可以考虑用监督学习的方法如果没有训练样本则不可能用监督学习的方法。但是事实上我们在针对一个现实问题进行解答的过程中即使我们没有现成的训练样本我们也能够凭借自己的双眼从待分类的数据中人工标注一些样本并把他们作为训练样本这样的话就可以把条件改善用监督学习的方法来做。当然不得不说的是有时候数据表达的会非常隐蔽也就是说我们手头的信息不是抽象的形式而是具体的一大堆数字这样我们很难凭借人本身对它们简单地进行分类。这个说的好像有点不大明白举个例子说就是在bag-of-words模型的时候我们利用k-means的方法聚类从而对数据投影这时候用k-means就是因为我们当前到手的只有一大堆数据而且是很高维的当我们想把他们分为50个类的时候我们已经无力将每个数据标记说这个数应该是哪个类那个数又应该是哪个类了。所以说遇到这种情况也只有无监督学习能够帮助我们了。那么这么说来能不能再深入地问下去如果有训练样本或者说如果我们可以获得到一些训练数据的话监督学习就会比无监督学习更合适呢照我们单纯地想有高人教总比自己领悟来的准来的快吧我觉得一般来说是这样的但是这要具体看看训练数据的获取。有人在课题的研究中手动标注了大量的训练样本当然这些样本基本准确了而且把样本画在特征空间中发现线性可分性非常好只是在分类面附近总有一些混淆的数据样本从而用线性分类器进行分类之后这样样本会被误判。然而如果用混合高斯模型(GMM)来分的话这些易混淆的点被正确分类的更多了。对这个现象的一个解释就是不管是训练样本还是待聚类的数据并不是所有数据都是相互独立同分布的。换句话说数据与数据的分布之间存在联系。在阅读监督学习的大量材料中大家都没有对训练数据的这一假设独立同分布进行说明。对于不同的场景正负样本的分布如果会存在偏移可能是大的偏移也可能偏移比较小这样的话用监督学习的效果可能就不如用非监督学习了。
另外关于判别学习和生成学习算法可以参照http://blog.csdn.net/andrewseu/article/details/46789121
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/924032.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!