html5导航网站源码wordpress发表的文章点不开

web/2025/9/29 9:11:20/文章来源:
html5导航网站源码,wordpress发表的文章点不开,编写软件的步骤,网页生成pdf失败在主成分分析#xff08;PCA#xff09;原理总结中#xff0c;我们对主成分分析(以下简称PCA)的原理做了总结#xff0c;下面我们就总结下如何使用scikit-learn工具来进行PCA降维。 一、scikit-learn PCA类介绍 在scikit-learn中#xff0c;与PCA相关的类都在sklearn.deco…在主成分分析PCA原理总结中我们对主成分分析(以下简称PCA)的原理做了总结下面我们就总结下如何使用scikit-learn工具来进行PCA降维。 一、scikit-learn PCA类介绍     在scikit-learn中与PCA相关的类都在sklearn.decomposition包中。最常用的PCA类就是sklearn.decomposition.PCA我们下面主要也会讲解基于这个类的使用的方法。     除了PCA类以外最常用的PCA相关类还有KernelPCA类在原理篇我们也讲到了它主要用于非线性数据的降维需要用到核技巧。因此在使用的时候需要选择合适的核函数并对核函数的参数进行调参。     另外一个常用的PCA相关类是IncrementalPCA类它主要是为了解决单机内存限制的。有时候我们的样本量可能是上百万维度可能也是上千直接去拟合数据可能会让内存爆掉 此时我们可以用IncrementalPCA类来解决这个问题。IncrementalPCA先将数据分成多个batch然后对每个batch依次递增调用partial_fit函数这样一步步的得到最终的样本最优降维。     此外还有SparsePCA和MiniBatchSparsePCA。他们和上面讲到的PCA类的区别主要是使用了L1的正则化这样可以将很多非主要成分的影响度降为0这样在PCA降维的时候我们仅仅需要对那些相对比较主要的成分进行PCA降维避免了一些噪声之类的因素对我们PCA降维的影响。SparsePCA和MiniBatchSparsePCA之间的区别则是MiniBatchSparsePCA通过使用一部分样本特征和给定的迭代次数来进行PCA降维以解决在大样本时特征分解过慢的问题当然代价就是PCA降维的精确度可能会降低。使用SparsePCA和MiniBatchSparsePCA需要对L1正则化参数进行调参。 二、sklearn.decomposition.PCA参数介绍     下面我们主要基于sklearn.decomposition.PCA来讲解如何使用scikit-learn进行PCA降维。PCA类基本不需要调参一般来说我们只需要指定我们需要降维到的维度或者我们希望降维后的主成分的方差和占原始维度所有特征方差和的比例阈值就可以了。     现在我们对sklearn.decomposition.PCA的主要参数做一个介绍     1n_components这个参数可以帮我们指定希望PCA降维后的特征维度数目。最常用的做法是直接指定降维到的维度数目此时n_components是一个大于等于1的整数。当然我们也可以指定主成分的方差和所占的最小比例阈值让PCA类自己去根据样本特征方差来决定降维到的维度数此时n_components是一个01]之间的数。当然我们还可以将参数设置为mle, 此时PCA类会用MLE算法根据特征的方差分布情况自己去选择一定数量的主成分特征来降维。我们也可以用默认值即不输入n_components此时n_componentsmin(样本数特征数)。     2whiten 判断是否进行白化。所谓白化就是对降维后的数据的每个特征进行归一化让方差都为1.对于PCA降维本身来说一般不需要白化。如果你PCA降维后有后续的数据处理动作可以考虑白化。默认值是False即不进行白化。     3svd_solver即指定奇异值分解SVD的方法由于特征分解是奇异值分解SVD的一个特例一般的PCA库都是基于SVD实现的。有4个可以选择的值{‘auto’, ‘full’, ‘arpack’, ‘randomized’}。randomized一般适用于数据量大数据维度多同时主成分数目比例又较低的PCA降维它使用了一些加快SVD的随机算法。 full则是传统意义上的SVD使用了scipy库对应的实现。arpack和randomized的适用场景类似区别是randomized使用的是scikit-learn自己的SVD实现而arpack直接使用了scipy库的sparse SVD实现。默认是auto即PCA类会自己去在前面讲到的三种算法里面去权衡选择一个合适的SVD算法来降维。一般来说使用默认值就够了。     除了这些输入参数外有两个PCA类的成员值得关注。第一个是explained_variance_它代表降维后的各主成分的方差值。方差值越大则说明越是重要的主成分。第二个是explained_variance_ratio_它代表降维后的各主成分的方差值占总方差值的比例这个比例越大则越是重要的主成分。 三、PCA实例     下面我们用一个实例来学习下scikit-learn中的PCA类使用。为了方便的可视化让大家有一个直观的认识我们这里使用了三维的数据来降维。     完整代码参见我的github: https://github.com/nickchen121/machinelearning/blob/master/classic-machine-learning/pca.ipynb     首先我们生成随机数据并可视化代码如下 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D %matplotlib inline from sklearn.datasets.samples_generator import make_blobs # X为样本特征Y为样本簇类别 共1000个样本每个样本3个特征共4个簇 X, y make_blobs(n_samples10000, n_features3, centers[[3,3, 3], [0,0,0], [1,1,1], [2,2,2]], cluster_std[0.2, 0.1, 0.2, 0.2], random_state 9) fig plt.figure() ax Axes3D(fig, rect[0, 0, 1, 1], elev30, azim20) plt.scatter(X[:, 0], X[:, 1], X[:, 2],markero)     三维数据的分布图如下     我们先不降维只对数据进行投影看看投影后的三个维度的方差分布代码如下 from sklearn.decomposition import PCA pca PCA(n_components3) pca.fit(X) print pca.explained_variance_ratio_ print pca.explained_variance_     输出如下 [ 0.98318212  0.00850037  0.00831751] [ 3.78483785  0.03272285  0.03201892]     可以看出投影后三个特征维度的方差比例大约为98.3%0.8%0.8%。投影后第一个特征占了绝大多数的主成分比例。     现在我们来进行降维从三维降到2维代码如下 pca PCA(n_components2) pca.fit(X) print pca.explained_variance_ratio_ print pca.explained_variance_     输出如下 [ 0.98318212  0.00850037] [ 3.78483785  0.03272285]     这个结果其实可以预料因为上面三个投影后的特征维度的方差分别为[ 3.78483785  0.03272285  0.03201892]投影到二维后选择的肯定是前两个特征而抛弃第三个特征。     为了有个直观的认识我们看看此时转化后的数据分布代码如下 X_new pca.transform(X) plt.scatter(X_new[:, 0], X_new[:, 1],markero) plt.show()     输出的图如下     可见降维后的数据依然可以很清楚的看到我们之前三维图中的4个簇。     现在我们看看不直接指定降维的维度而指定降维后的主成分方差和比例。 pca PCA(n_components0.95) pca.fit(X) print pca.explained_variance_ratio_ print pca.explained_variance_ print pca.n_components_     我们指定了主成分至少占95%输出如下 [ 0.98318212] [ 3.78483785] 1     可见只有第一个投影特征被保留。这也很好理解我们的第一个主成分占投影特征的方差比例高达98%。只选择这一个特征维度便可以满足95%的阈值。我们现在选择阈值99%看看代码如下 pca PCA(n_components0.99) pca.fit(X) print pca.explained_variance_ratio_ print pca.explained_variance_ print pca.n_components_     此时的输出如下 [ 0.98318212 0.00850037] [ 3.78483785 0.03272285] 2     这个结果也很好理解因为我们第一个主成分占了98.3%的方差比例第二个主成分占了0.8%的方差比例两者一起可以满足我们的阈值。     最后我们看看让MLE算法自己选择降维维度的效果代码如下 pca PCA(n_componentsmle) pca.fit(X) print pca.explained_variance_ratio_ print pca.explained_variance_ print pca.n_components_     输出结果如下 [ 0.98318212] [ 3.78483785] 1     可见由于我们的数据的第一个投影特征的方差占比高达98.3%MLE算法只保留了我们的第一个特征。   欢迎转载转载请注明出处。欢迎沟通交流 微信nickchen121 转载于:https://www.cnblogs.com/nickchen121/p/11214894.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/83813.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件开发顺序wordpress媒体优化

在工作中遇到对接java接口,涉及到java加密或签名问题,.net无法实。就将java代码编辑为dll给.net调用 注:这里只做简单java代码处理,不涉及到复杂的java包 java文件处理: 第一步:简单java代码 package com.zht;//c#命名…

php 怎么做视频网站wordpress 付费注册

转载于:https://www.cnblogs.com/cmyg/p/7206474.html

网站建设:什么是网站开发与建设

1.题目 如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后,短语正着读和反着读都一样。则可以认为该短语是一个 回文串 。 字母和数字都属于字母数字字符。 给你一个字符串 s,如果它是 回文串 ,返回 true ;否…

优化网站用什么软件好做外贸没有企业网站

DFS 蓝桥杯中的DFS主要有针对分配过程的DFS和图/树的DFS两种类型,基本是模板题,难度中等 类型一:针对分配过程的DFS 例题 1:飞机降落 题目描述: N 架飞机准备降落到某个只有一条跑道的机场。其中第 i 架飞机在 T …

西安网站seo外包seo入门讲解

使用docker-compose优雅部署RocketMQ 随着市场的发展,越来越多的复杂场景出现在我们日常的开发工作中。随之也越来越多的好的工具,也同步出现在程序员的学习范围清单内。好的工具提高产品性能的同时,也带来了很多安装上的问题,do…

什么网站百度容易收录线上直播营销策划方案

随着区块链技术的迅速发展和数字资产市场的蓬勃发展,区块链交易所成为了数字资产交易的核心场所之一。在这个快速发展的领域中,区块链交易所App系统的开发和撮合交易系统的建设至关重要。本文将探讨区块链交易所App系统开发及撮合交易系统的重要性&#…

合肥有什么好的网站建设公司win7优化配置的方法

给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。 思路:每个循环中,sum表示以nums[i]结尾的最大子序和,res表示目前得到的最大子序和。当循环结…

推广链接网站小程序开发定制公司北京

1. 数据库基础 1.1 什么是数据库 存储数据用文件就可以了,为什么还要弄个数据库? 文件保存数据有以下几个缺点: 文件的安全性问题文件不利于数据查询和管理文件不利于存储海量数据文件在程序中控制不方便 数据库存储介质: 磁盘内存 为…

广州网站建设开发公司建设银行深圳天健世纪支行网站

BeetleX针对redis访问封了全async/await操作模式,通过它可以更高效地访问redis服务。BeetleX.Redis提供读写分离和多机故意写入处理,同时安全的TLS访问机制,在使用功能上组件支持绝大部分基础指令,并提供json,protobuf…

手机端网站源码抖音带运营的执行老大

在当今信息化快速发展的时代,手机已经成为我们生活中不可或缺的一部分。随着资料的积累,备份手机数据成了一个重要的问题。本文将介绍iMazing如何备份手机资料,并为大家解答“iPhone的资料可以传到iPad里吗”这一问题。这不仅可以帮助你有效管…

怎么制作网站链接用wordpress做企业门户

网络基础(一) 文章目录 一、计算机网络背景1.1网络发展1.2认识“协议” 二、网络协议初识2.1OSI七层模型2.2OSI五层模型 三、网络传输基本流程3.1局域网通信3.2网络传输流程不跨子网的网络传输跨子网的网络传输 3.3网络中的地址管理IP地址MAC地址 一、计…

木质家居 技术支持 东莞网站建设自适应式网站模板

RpcProvider&#xff08;服务提供者&#xff09;实现思路 上一节说到&#xff0c;如何将一个本地服务发布成远程服务&#xff0c;但没有说明一个rpc框架怎么进行调用的&#xff0c;看看上节代码 #include <iostream> #include <string> #include "user.pb.h…

网站建设海报图片国外品牌vi设计

引言 数字化转型是当今商业领域中的关键议题&#xff0c;它不仅是技术的应用&#xff0c;更是一种战略性的变革&#xff0c;对企业而言具有重要意义。在这个数字化时代&#xff0c;企业需要不断适应和采纳新技术&#xff0c;以获得竞争优势并提高效率。 数字化转型旨在将传统业…

网站使用特殊字体陇西做网站的广告店

同步任务是指在多个线程之间协调执行的任务&#xff0c;其目的是确保多个任务按照一定的顺序和规则执行&#xff0c;例如使用锁来防止数据竞争。 同步任务的实现需要考虑多个线程之间的协作和同步&#xff0c;以确保数据的正确性和程序的正确执行。 由于TaskPool偏向于单个独…

网站商务方案平面设计的图

一、单选题&#xff08;35题&#xff0c;每题2分&#xff09; 1、(2分)【单选题】以下用于修改数据库字段名称的SQL语句是&#xff08;&#xff09; A.RENAME B.CHANGE C.ALTER D.MODIFY 2、(2分)【单选题】若一棵二叉树的前序遍历为a,e, b, d. c&#xff0c;后序遍历为 b, …

网站技术制作流程图做网站好做吗

作者 | 何从庆转载自AI算法之心(ID:AIHeartForYou)笔者整理最近几年比较经典的深度文本分类方法&#xff0c;希望帮助小伙伴们了解深度学习在文本分类中的应用。Convolutional Neural Networks for Sentence Classification (EMNLP 2014)Kim在EMNLP2014提出的TextCNN方法&…

济宁网站定制公司备案的网站做跳转不影响备案把

目录 一、nginx是什么&#xff1f; 二、安装部署 1.下载 2.配置 3.代理Swagger服务 4.nginx命令 一、nginx是什么&#xff1f; 是用于 Web 服务、反向代理、内容缓存、负载均衡、媒体流传输等场景的开源软件。它最初是一款专为实现最高性能和稳定性而设计的 Web 服务器。…

陕西省建设厅执业资格注册中心网站网站建设管理流程

在传统合同签署的过程中&#xff0c;企业、组织、机构都面临着合同签署与管理的诸多问题和挑战&#xff1a;合同种类繁多、数量庞大导致起草效率低下&#xff1b;管理流程繁琐、权限分散使得审批周期冗长且效率低下&#xff1b;合同签订版本难以精准复核&#xff0c;风险防控更…

哈尔滨快速建站服务网站建设计划

创建用于初始化的非完全结构体非完全初始条件结构体为总线的部分元素提供初始值。如果您在仿真过程中使用非完全初始条件结构体&#xff0c;Simulink 将创建一个完全的初始条件结构体来表示总线的所有元素。对于非完全初始条件结构体没有显式指定值的每个元素&#xff0c;Simul…

体检网站源码哈尔滨网站建设那家好

我们在做项目的时候&#xff0c;应该给经常用到的文件配置它的别名&#xff0c;这样做&#xff0c;既可以方便引用&#xff0c;也可以防止当文件位置发生改变的时候出现错误。 配置前: import bartar from ../../components/bartar 配置后(不用再关心文件层级关系): import bar…