matlab pca和逆pca函数,matlab_PCA,训练集与测试集分开,原理和用法

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

PCA基本流程:

1、训练集矩阵算协方差矩阵A;

2、算协方差矩阵特征值与特征向量;

3、按特征值的大小排列特征矩阵,得B,对应的特征值(按从大到小排列)组成向量a;

4、A*B得到去关联的新矩阵C,A与C的对应位置物理意义相同(指样本维度和样本数),但是去掉了关联,并且按特征贡献度大小排列;

5、选贡献度百分比或降维后的维度。例如百分之90,则是取满足sum(a(1:n))/sum(a)>90%的最小的n;如果直接定降维后的维度,则直接设置个n。

6、任一样本的降维公式相同,对于样本x:x*B(1:n,:)。

原理说明:步骤3,4本质上是基变换原理。4可以去关联的原理与马氏距离相仿。贡献度的原理与协方差矩阵的数学意义相关。转换矩阵相关的计算必须在训练集上完成是因为协方差矩阵的计算需要一个样本集,如将测试集样本加入这个样本集,则训练集中已经包含了测试集信息(例如某一维特征的均值)。

matlab函数说明:

[COEFF, SCORE, LATENT] = pca(X);

COEFF:步骤3算出来的矩阵B,本质上是一个基变换矩阵。数学意义是协方差矩阵按特征值的大小排列的特征矩阵。

SCORE:步骤4算出来的矩阵C,与A同维同物理意义。

LATENT:步骤3算出来的向量a,存储了贡献度,数学意义是协方差矩阵特征值从大到小排列。

用途:根据LATENT计算满足某贡献度所需的样本维度,或直接定一个样本维度,然后

x*COEFF(1:n,:)降维。

把训练集中所有样本计算x*COEFF就是SCORE,当然,x*COEFF(1:n,:)这个式子更大的用途是计算测试集中的样本。

以上全是废话,这里是关键的:

pca内建函数在算协方差的时候先减了个样本均值,所以这里x*COEFF不是SCORE

需要先算

x0 = bsxfun(@minus,train_data,mean(train_data,1));

x0 = bsxfun(@minus,test_data,mean(test_data,1));

然后x0*x*COEFF才是SCORE

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/442565.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

w3cschool php 调整图片尺寸,PHP_php修改上传图片尺寸的方法,本文实例讲述了php修改上传图 - phpStudy...

php修改上传图片尺寸的方法本文实例讲述了php修改上传图片尺寸的方法。分享给大家供大家参考。具体实现方法如下:// This is the temporary file created by PHP$uploadedfile $_FILES[uploadfile][tmp_name];// Create an Image from it so we can do the resize$…

matlab频域低通滤波程序,低通频域滤波器在Matlab中的设计与实现.pdf

低通频域滤波器在Matlab中的设计与实现’ … … … … … ’ ’实用第一..智‘‘慧密集. . . . . . . . … … . . . … &…

matlab做比例积分微分控制,PID控制器的微积分分析matlab代码

PID 控制器由比例环节(Proportional)、积分环节(Integral )和微分环节(Differential )组成,连续PID 控制器的一般形式:dt de K d e K t e K t u D tI p )()()()()(0τττ? 一、比例控制及性能分析比例控制器的传递函数为:p p K s G )( 例题…

php引用对象方法吗,在PHP中引用容器对象的方法?

您必须修改代码才能提供关系.在OOP中,我们称之为aggregation.假设PHP 4,以及“一系列条形图”的想法class foo {var $bars array();function __construct() {"Foo Exists!";}function magic_bullet($id) {switch($id) {case 1:echo "There is no spoon! "…

数据合并计算php,各位大神,求助如果用VBA实现以下数据合并以及数量计算

Option ExplicitModuleName"模块1"Dim aData, dic As Object, aResSub start()Dim i&, n&, aTmp, minNum, maxNumDim spNum&, strData, id, numaData Range("a1").CurrentRegionSet dic CreateObject("Scripting.Dictionary")For …

python执行文件函数,python如何运行函数

运行Python的函数,只需要调用函数名,在传递参数就可以,不必关心函数体内部的代码块。函数是带名字的代码块,用于完成具体的工作需要在程序中多次执行同一项任务时,你无需反复编写完成该任务的代码,而只需调…

php小白书,php小白的自学第一天

虽然我还没有学会Python,但是已经开学了……然后老师要验收以php编写的网页……(wdnmd )这两天先把这个网页设计处理了,Python也会学,Linux还没开始,web更是啥也不会……谁再和我说大学比高中轻松我跟他拼命(听说只要先熟悉了HTML…

linux配置文件为yum,yum的配置文件说明

1、网上的可供yum的链接,要求里面有repodata目录,该目录就是分析 RPM 软体后所产生的软体属性相依资料放置处。2、配置文件:/etc/yum.repos.d/CentOS-Base.repo,也可以此目录下建别的以.repo后缀的文件就行[base]:代表…

linux的命令窗口,(翻译)Linux命令行(二)

文件和目录操作cd /home 进入/home目录cd .. 返回上一层目录cd ../.. 返回上两层目录cd 回到用户目录cd ~utente 回到用户目录cd - 后退到刚才目录pwd …

linux emacs配置文件,[z]使用.emacs.d目录管理Emacs配置文件

第一启动emacs会在~目录下创建.emacs.d目录使用.emacs.d目录管理Emacs配置文件参考:Declaring .emacs BankruptcyEmacs的默认配置文件是.emacs,Emacs启动时会读取并执行.emacs中的LISP代码,用户使用.emacs达到自己的Emacs初始化配…

linux操作系统权限详解,Linux权限详解

权限权限是操作系统用来限制对资源访问的机制。权限一般分为读、写、执行。每个用户都有特定的权限、所属用户、所属组,通过这样的机制来限制哪些用户、哪些组可以对待特定的文件进行怎么样的操作。每个进程都是以某个用户的身份运行,所以进程的权限与该…

Linux 内核 颜色,Linux操作系统内核版的表示方法是( )

(8分)将煤粉隔绝空气加强热,除主要得到焦炭外,还能得到下表所列的物质:序号①②③④⑤⑥⑦名称甲烷一氧化碳乙烯苯在家庭中进行的下列实验或做法可行的是()A.用食醋区分食盐和纯碱B.将食盐经溶解、过滤、蒸发来制纯净的…

linux中检测用户信息的命令是,在Linux系统上检查用户所属组

Linux 管理员经常进行的一项操作之一:那就是把用户添加到现有组,这是在一些大环境工作的 Linux 管理员日常经常从事的操作之一,所以经常会在 Linux 系统上检查用户所属组,本文就来谈谈这方面的知识。我会因为业务需求而在我的环境…

Linux生态ox版本,从折腾说Linux生态圈

这几天折腾路由器过墙,累得一头大汗。这些天本来挺忙的,需要很多时间去做一些“正经的"事情,却因为原来的过墙方法不可以用了,又是各种学习网络知识,又是各种脚本配置的折腾。在这件事上足足花了有七八个小时。不…

linux上听FM程序,安装和使用Odio在Linux上收听FM收音机的方法

Linux平台上有一些很棒的无线电应用程序可用于在Linux上收听FM Radio(收音机),本文介绍Odio,包括安装和使用它来收听FM收音机的方法。启用S​​nap支持和安装Odio由于Snap软件包,Odio无线电应用在Linux上得到了支持,在Linux上&…

go linux 源码编译环境,修改并编译golang源码

Go 语言诞生5周年!友情提示:本文使用Markdown编写,黑色背景文字可能需要横向拖动才能看清全文最近为了做Hyperledger Fabric国密改造,涉及到了golang源码的改动。特将操作过程整理如下,以供参考:golang的源…

linux多线程编程和linux 2.6下的nptl,Linux多線程編程和Linux 2.6下的NPTL

這幾天由於工作需要,琢磨了一下Linux下的多線程的相關資料。Linux下最常用的多線程支持庫為Pthread庫,它是glibc庫的組成部分。但是關於Pthread的說明文檔非常缺乏,特別是對POSIX多線程規范的介紹以及pthread庫中多線程實現方式的介紹實在是少…

linux快照软件哪个好,Linux下的快照snapshot的实现

最近的移植工作碰到了关于快照的问题,windows在这方面真是强大,留给了用户很多好的接口。而Linux下只能针对LVM卷建立快照,还好有一个比较强大的lvm管理器。不过lvm管理需要你安装,而且很多Linux用户可能并没有进行分区以及建立lv…

linux如何用cat看一行数据库,linux的cat命令

linux下cat命令最基本的用法是用来查看文件内容。那么它的其他用法是什么呢?下面由学习啦小编为大家整理了linux的cat命令的相关知识,希望大家喜欢!linux的cat命令用法1:查看文件内容主要用法1、cat f1.txt,查看f1.txt文件的内容。2、cat -n f1.txt&…

linux 内核空间 sy,在 Linux 下用户空间与内核空间数据交换的方式,第 1 部分: 内核启动参数、模块参数与sysf...

级别: 初级燚 杨 (), 计算机科学硕士2006 年 2 月 16 日本系列文章包括两篇,它们文详细地介绍了 Linux 系统下用户空间与内核空间数据交换的九种方式,包括内核启动参数、模块参数与 sysfs、sysctl、系统调用、netlink、procfs、seq_file、deb…