深圳证券网站开发城市网站建设分析报告
web/
2026/1/13 11:56:44/
文章来源:
深圳证券网站开发,城市网站建设分析报告,企业电器网站建设方案,排版设计专业Jaccard 相似系数又称为Jaccard相似性度量#xff08;Jaccard系数#xff0c;Jaccard 指数#xff0c;Jaccard index#xff09;。用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大#xff0c;样本相似度越高。定义为相交的大小除以样本集合的大小#xff1a;…Jaccard 相似系数又称为Jaccard相似性度量Jaccard系数Jaccard 指数Jaccard index。用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大样本相似度越高。定义为相交的大小除以样本集合的大小 若A B均为空那么定义JAB 1
与 Jaccard 相似系数相对的指标是Jaccard 距离Jaccard distance定义为 1- Jaccard系数即 Python 代码
data_school_list data[school].unique().tolist() #school列表
edu_similar[]
l len(data_school_list)#定义循环次数
for i in data_school_list:try:print(l)#显示当前计算的进度Jaccard_list []#建立一个空白列表用于存储Jaccar系数true_id data.loc[data[school] i,id].tolist() #id列表for m in range(len(true_id)):true_ids copy.copy(true_id)#复制id列表true_ids.pop(m)for n in range(len(true_ids)):data_id_x data.loc[data[id] true_id[m],school].tolist()data_id_y data.loc[data[id] true_id[n],school].tolist()union_set len(list(set(data_id_x)|set(data_id_y)))#并集长度intersection_set len(list(set(data_id_x)set(data_id_y)))#交集长度Jaccard intersection_set/union_set #Jaccard IndexJaccard_list.append(Jaccard)#插入listJaccard_array np.array(Jaccard_list)Jaccard_mean np.mean(Jaccard_array)Jaccard_std np.std(Jaccard_array)Jaccard_list [i,Jaccard_mean,Jaccard_std]edu_similar.append(Jaccard_list)l-1#l-1进行下一个循环直到数据中每一条都计算完毕except:Jaccard_list [i,0,0]edu_similar.append(Jaccard_list)l-1
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/89205.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!