深入解析:机器学习——聚类算法

news/2025/10/23 11:43:52/文章来源:https://www.cnblogs.com/slgkaifa/p/19160149

深入解析:机器学习——聚类算法

一、聚类的概念

根据样本之间的相似性,将样本划分到不同的类别中的一种无监督学习算法。

细节:根据样本之间的相似性,将样本划分到不同的在没有先验知识的情况下,自动发现素材集中的内在结构和模式。就是类别中;不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。聚类算法的目的计算样本和样本之间的相似性,一般使用欧式距离

二、聚类算法分类

根据聚类颗粒度分类:细粒度和粗粒度。

根据搭建方法分类:

基于划分的聚类:K-means算法->按照质心(一个簇的中心位置,凭借均值计算)分类;

基于层次的聚类:DIANA(自顶向下)AGNES(自底向上);

基于密度的聚类: DBSCAN算法

......

三、Kmeans算法流程/原理

K值的含义:表示聚类个数,参数n_clusters就是指定k值的。

API:sklearn.cluster.KMeans

流程:1.事先确定常数k,即最终聚类类别数;

           2.随机选择k个样本作为初始聚类中心;

           3.计算每个样本到k个中心的距离,选择最近的聚类中心点作为标记类别;

           4.根据每个类别中的样本点,重新计算出新的聚类中心点(平均值),如果计算得出的新中心点与原中心点一样则停止聚类,否则重新进行第三步过程,直到聚类中心不在变化或者达到最大迭代次数。

四、聚类评估方法

1.SSE“肘”方法

计算簇内误差的平方和,SSE越小,聚类效果越好

SSE=\sum_{i=1}^{k}\sum_{p\epsilon C_{i}}^{}\left | p-m_{i} \right |^{2}

2.SC轮廓系数

综合考虑簇内的内聚程度与簇间的分离程度,SC越大,聚类效果越好

S=\frac{\left ( b-a \right )}{max\left ( a,b \right )}

3.CH轮廓系数

综合考虑簇内的内聚程度、簇间的分离程度、质心的个数,CH越大,聚类效果越好

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/944144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ASP.NET Core Blazor 路由配置和导航

大家好,我是码农刚子。本文系统介绍了Blazor单页应用的路由机制。主要内容包括:1)基础路由配置,通过@page指令定义URL映射;2)路由参数处理,支持参数约束、可选参数和通配符捕获;3)编程式导航实现,利用Naviga…

session cookie token的区别

核心区别:session是服务器端存储的用户会话数据,cookie是客户端(浏览器)存储的小型文本,token是无状态的身份凭证,通常由客户端携带、服务器验证。存储位置与安全性• Session:存于服务器(内存/数据库),安全…

基于DSP的伺服电机驱动器程序设计

基于DSP的伺服电机驱动器程序设计,结合TMS320F2806芯片特性及工业级实现标准:一、硬件架构设计 1. 核心电路拓扑 DSP(TMS320F2806) ├── PWM模块 → IR2110驱动芯片 → IGBT逆变桥 ├── CAP模块 → 霍尔位置…

cookie和缓存的区别

核心区别:cookie是用于存储用户身份、偏好等小量会话数据的客户端文本文件,而缓存是用于暂存网页资源(如图片、JS)以加速加载的本地存储,二者用途和数据类型完全不同。核心用途• Cookie:核心是“记录用户信息”…

【内网渗透】第168天:基石框架篇单域架构域内应用控制成员组成用户策略信息收集环境搭建

安全级别最高的LAN Area(内网); 安全级别中等的DMZ区域; 安全级别最低的Internet区域(外网)。 三个区域因担负不同的任务而拥有不同的访问策略。 1.内网域 分类:单域、子域、父域、域树、域森林、DNS域名服务器…

2025年常州健身房私教权威推荐榜:专业教练资质与个性化课程服务的口碑之选

2025年常州健身房私教权威推荐榜:专业教练资质与个性化课程服务的口碑之选 在健康意识日益增强的当下,健身行业迎来了前所未有的发展机遇。作为长三角地区的重要城市,常州的健身市场呈现出蓬勃发展的态势。随着消费…

电脑没声音怎么办?4种方法快速修复电脑无声问题(实测有效)

当电脑突然没声音时,很多用户会以为是硬件故障,其实90%以上的情况都能自行修复。本文系统讲解了 电脑没声音的常见原因,并提供了4种实测有效的解决方案——从基础音量设置、硬件连接检查,到声卡驱动更新与系统音频…

易基因:JAR (IF13):西农陈玉林团队多组学分析揭示绵羊早期胚胎发育的分子与表观遗传调控机制|项目文章

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 近日,西北农林科技大学博士后金妙函等为第一作者,陈玉林教授和王小龙教授为通讯作者,在国际知名期刊《Journal of Advanced Research》上发表题为…

2025 年一线门窗厂家最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析

在门窗行业,一线品牌凭借技术研发、智能制造与市场服务能力,持续引领产业升级。本文基于企业产能、专利成果、客户案例及行业调研数据,深度解析2025年综合实力领先的三大门窗生产企业。 TOP1 佛山市安格尔门窗有限公…

uniapp h5内嵌h5重复进入css动画卡顿的问题

大该原因是内嵌的h5问题,但具体原因不知道,有那位大神知道麻烦告诉我一下,我这个解决文案也是最后的手段 因为内嵌h5的生命周期只在第一次进入页面时执行,后面重复进入不会执行,所以没有办法通过onshow来重复触发…

2025 年北京杜拉维特马桶公司最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析

在高端卫浴市场,北京杜拉维特马桶凭借其创新技术体系与精细化服务模式,持续领跑行业。据2025年《中国卫浴产业白皮书》数据显示,该品牌在华北市场占有率已达28.3%,智能马桶产品返修率控制在0.45% 以下,远低于行业…

http明文容易暴露信息

Wireshark抓包工具:https://www.wireshark.org/filter 过滤语句:http.request.method==POST只显示了http 协议下 post 请求的数据包信息中有login登录信息明文传输会显示用户名和密码

2025 年青岛金属材料检测公司最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析

随着工业质量要求不断提升,金属材料检测成为保障产品安全与性能的关键环节。为帮助企业精准选择合作伙伴,本文通过对青岛地区主流检测公司的技术设备、服务案例、检测精度及行业口碑进行综合评估,发布2025年金属材料…

2025 年铝门窗厂家最新推荐榜:系统/智能/断桥/窄边/定制/全景/阳光房/隐框/隔声/防火铝门窗公司推荐

引言 随着建筑装饰行业升级,铝门窗市场需求激增,但行业乱象也让消费者与采购方陷入选择困境。部分小厂缺乏规范生产体系,产品材质不达标、工艺粗糙,导致耐用性差;多数品牌产品同质化严重,难以满足个性化与高性能…

MATLAB实现蒙特卡洛法的10负荷点配电网可靠性计算

一、程序架构设计 graph TD A[初始化参数] --> B[构建电网拓扑] B --> C[生成故障场景] C --> D{状态转移模拟} D -->|故障发生| E[计算停电影响] D -->|正常运行| F[记录可靠性数据] E --> G[更新可…

2025 年苏州机械设备EAC认证公司最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析

在全球化贸易背景下,机械设备出口至俄语区及独联体国家需通过EAC认证,以确保产品符合海关联盟技术法规。苏州作为中国制造业重镇,多家认证公司在此领域竞争激烈。本文基于2025年行业调研数据,从企业专业团队实力、…

从普通用户到影视后期都能用!Topaz Video AI 7.0.0 靠 AI 搞定视频修复与质量升级

介绍 在视频创作与后期领域,低分辨率画面模糊、高帧率转换卡顿、压缩伪影明显等问题,一直是影响作品质量的核心痛点。尤其对于开发者、影视后期人员及内容创作者而言,既需要高效的工具解决画质问题,又希望避免依赖…

AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践

引言 AI Agent其基础架构可以简单划分为 Agent = LLM + 任务规划(Plan) + 记忆(Memory) + 工具使用(Tools),现象级的AI Agent,例如deepresearch、manus、claude code等都在这个基础框架上构建。图源 https://w…

可调恒压恒流直流电源的技术特性与应用价值分析

可调恒压恒流直流电源具备智能切换、高精度控制、人机交互和全方位保护,广泛应用于电子测试与供电系统。可调恒压恒流直流电源作为现代电子测试与供电系统的核心设备,其技术特性直接决定了应用的广度与深度。该类电源…

高通QCS8550部署YOLO-NAS模型与性能测试

(原创作者@CSDN_伊利丹~怒风) 前言 随着边缘智能技术的飞速发展,实时目标检测在安防监控、自动驾驶等场景的需求日益迫切,这对边缘设备的算力与能效提出了严苛要求。高通 QCS8550 作为物联网领域的高端处理器,凭借…