记录F1分数和召回率

内容

参考博文:

  1. F1分数以及micro、macro区别
    对于上面说的矩阵是不是挺懵的,它的真名叫混下矩阵,看下面

  2. 混淆矩阵
    所有正确的预测结果都在对角线上,所以从混淆矩阵中可以很方便直观的看出哪里有错误,因为他们呈现在对角线外面。
    它允许我们做出更多的分析,而不仅仅是局限在正确率。准确率对于分类器的性能分析来说,并不是一个很好地衡量指标,因为如果数据集不平衡(每一类的数据样本数量相差太大),很可能会出现误导性的结果。例如,如果在一个数据集中有95只猫,但是只有5条狗,那么某些分类器很可能偏向于将所有的样本预测成猫。整体准确率为95%,但是实际上该分类器对猫的识别率是100%,而对狗的识别率是0%。

  3. 怎么求F1分数呢? 代码实现?
    在Sklearn库中有现成的代码:
    输入: 必须是1-array的预测和GT
    输出: 得到相应的结果
    sklearn.metrics.f1_score 使用方法
    sklearn.metrics.f1_score中micro、macro、samples理解

  4. 适用什么场景?
    在这里插入图片描述
    也就是后者会注重所有分类效果都得好! 平均效果!
    而micro则是会带有权重的思想

代码

我的实现:

def evaluation_metric(pred, label):'''pred: Prediction results with whatever sizelabel: Label with whatever sizereturn: [Evaluation Metric]'''# average=None, get the P, R, and F1 value of a single classpred = numpy.asarray(pred)label = numpy.asarray(label)Precision = precision_score(y_true=label, y_pred=pred, average="macro")Recall = recall_score(y_true=label, y_pred=pred, average="macro")F1_score = f1_score(y_true=label, y_pred=pred, average="macro")F1_score_micro = f1_score(y_true=label, y_pred=pred, average="micro")return Precision, F1_score, Recall, F1_score_micro

其中average参数有下面的几个选项

y_true:1d数组,或标签指示符数组/稀疏矩阵基本事实(正确)目标值。y_pred:1d数组,或标签指示符数组/稀疏矩阵分类器返回的估计目标。labels:list,optional包括when的标签集,以及if的顺序。可以排除数据中存在的标签,例如,以忽略多数否定类别的方式计算多类平均值,而数据中不存在的标签将导致宏平均值中的0成分。对于多标签目标,标签是列索引。默认情况下,和 中的所有标签均按排序顺序使用。average != 'binary'average is Noney_truey_predpos_label:strint,默认值为1要报告是否average='binary'以及数据是否为二进制的类。如果数据是多类或多标签的,则将被忽略;设置,labels=[pos_label]并且只会报告该标签的得分。average != 'binary'average:string, [None, ‘binary’ (default), ‘micro’, ‘macro’, ‘samples’, ‘weighted’]对于多类/多标签目标,此参数是必需的。如果为None,则返回每个班级的分数。否则,这将确定对数据执行的平均类型:'binary':仅报告由指定的类的结果pos_label。仅在目标(y_{true,pred})为二进制时适用。'micro':通过计算正确,错误和否定的总数来全局计算指标。'macro':计算每个标签的指标,并找到其未加权平均值。这没有考虑数据数量的不平衡。而是平等地对待每一类'weighted':计算每个标签的指标,并找到其平均权重(受支持)(每个标签的真实实例数)。这改变了“宏观”以解决标签的不平衡。这可能导致F得分不在精确度和召回率之间。'samples':计算每个实例的指标,并找到其平均值(仅对不同于的多标签分类有意义 accuracy_score)。sample_weight:array-like of shape (n_samples,), default=None样品重量。zero_division:“warn”, 0 or 1, default=”warn”设置除法为零(即所有预测和标签均为负)时返回的值。如果设置为“ warn”,则该值为0,但也会发出警告。

返回值:

f1_score:float or array of float, shape = [n_unique_labels]二进制分类中的阳性类别的F1分数,或者对于多类别任务,每个类别的F1分数的加权平均值。

例子:

 Examples-------->>> from sklearn.metrics import precision_score>>> y_true = [0, 1, 2, 0, 1, 2]>>> y_pred = [0, 2, 1, 0, 0, 1]>>> precision_score(y_true, y_pred, average='macro')0.22...>>> precision_score(y_true, y_pred, average='micro')0.33...>>> precision_score(y_true, y_pred, average='weighted')0.22...>>> precision_score(y_true, y_pred, average=None)array([0.66..., 0.        , 0.        ])>>> y_pred = [0, 0, 0, 0, 0, 0]>>> precision_score(y_true, y_pred, average=None)array([0.33..., 0.        , 0.        ])>>> precision_score(y_true, y_pred, average=None, zero_division=1)array([0.33..., 1.        , 1.        ])"""

其中micro是求的全部的准确率! 没有考虑数据的平衡性!

average = “micro” = average=NULL

precision_score
recall_score
f1_score

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476072.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《大话设计模式》读书笔记-建造者模式

// 建造者类 class PersonDirector { private PersonBuilder pb; public PersonDirector(PersonBuilder pb) { this.pb pb; } public void CreatePerson() { pb.BuildHead(); pb.BuildBody(); …

LeetCode 1170. 比较字符串最小字母出现频次

1. 题目 我们来定义一个函数 f(s),其中传入参数 s 是一个非空字符串; 该函数的功能是统计 s 中(按字典序比较)最小字母的出现频次。 例如,若 s “dcce”,那么 f(s) 2,因为最小的字母是 “c”…

讯达机器人_科大讯飞新品频发完善场景布局“双11”斩获三大平台25项冠军

11月12日,科大讯飞发布”双11”战报,C端产品兑现AI红利实现可持续增长,一举斩获京东、天猫、苏宁易购三大平台25项冠军。11月1日至11月11日,销售额同比增长56% 。目前,科大讯飞消费者业务连续三年保持营收超过30%的增速…

【Eclipse 插件】Implementors

当追踪方法代码时,Eclipse默认是转到方法的接口类,而接口中是只有方法名称没有具体的实现代码,此插件提供了追踪到具体实现类的实现代码的功能。官方地址 转载于:https://www.cnblogs.com/derod/archive/2010/01/14/1647509.html

常见报错原因

因为经常犯这个错,但是还不记住! 以此来告诫自己! 1. KeyError 表示当前Key就没有!!! 去检查一下,你出错的字典或者是列表(一般出这个错误肯定有个对照! )…

jQuery验证validate插件

灰常好用 jquery.validate.js 当然还是用插件.... 别忘记引用JQuery 自带类库 ------------------------------------------- 使用前介绍下label属性 当用label标签把一段文本和一个控件绑定之后,用户点击文本,相关的控件就会获得焦点。 隐式绑定不需使用…

安装ssd后不识别网卡_100元体验纯正万兆网络:需要安装SSD的NAS服务器

万兆网络似乎离普通玩家一直很遥远,不过借着万能的闲鱼,小编100块搞到一张非常便宜的二手电口万兆网卡,配合安装固态硬盘的NAS网络存储服务器,万兆网络走起来~这张卡用的是BCM57710芯片,网上都说只能在Win 7或者同时期…

【KPGNN】运行错误与成功后的合集

出错合集 1. AssertionError 这句话的意思是: DGLGraph.readonly已经不可用了,而现在高版本的DGLGraph总是支持mutable! 记住是总是,一直!!! 所以现在由于版本问题,使用了高版本&a…

react获取id_解决React应用界面开发常见痛点(一)业务逻辑与UI分离

前言:本系列是针对于React在界面开发痛点的一些解决方案,只是React应用中偏向展示的一环构建一个业务与UI分离的react应用本篇是基于HOC方案并未使用Hooks业务逻辑与UI在编写一个react组件前,我们一定要弄清两件事。什么是UI?什么…

(二十六)【2021 WWW】Knowledge-Preserving Incremental Social Event Detection via Heterogeneous GNNs

题目: Knowledge-Preserving Incremental Social Event Detection via Heterogeneous GNNs 中文题目: 基于异构gnn的知识保持增量社会事件检测 学习目标 学习怎么知识增强的? 学习怎么处理时间等多个因素的? 学习怎么构建子图…

LeetCode 931. 下降路径最小和(动态规划)

1. 题目 给定一个方形整数数组 A,我们想要得到通过 A 的下降路径的最小和。 下降路径可以从第一行中的任何元素开始,并从每一行中选择一个元素。在下一行选择的元素和当前行所选元素最多相隔一列。 示例: 输入:[[1,2,3],[4,5,6…

IL应用之——用IL分析接口的本质

IL反编译利器——Ildasm.exe和Reflector.exe:一:Ildasm.exe简介 这一微软VS自带工具,在上一篇博文《初识Ildasm.exe——IL反编译的实用工具》中已经做了详细介绍,这里不再鳌述;二:Reflector.exe简介 至此(1…

自定义_如何自定义协议

前言何为自定义协议,其实是相对标准协议来说的,这里主要针对的是应用层协议;常见的标准的应用层协议如http、ftp、smtp等,如果我们在网络通信的过程中不去使用这些标准协议,那就需要自定义协议,比如我们常用…

vs 2008 Ide 设置

/Files/chenhs/CurrentSettings-2009-08-02.rar/Files/chenhs/vs2005_vs2008_scottgu_vssetings.rar 转载于:https://www.cnblogs.com/chenhs/archive/2010/02/05/1664095.html

(二十七)【2021 WWW】Learning Intents behind Interactions with Knowledge Graph for Recommendation

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OpZWgm7T-1634540652258)(C:\Users\小轩\AppData\Roaming\Typora\typora-user-images\image-20211018091530075.png)] 创新性 提出了新的GNN聚合方案提出了意图图,每个意图图是将每个inte…

LeetCode 949. 给定数字能组成的最大时间(暴力)

1. 题目 给定一个由 4 位数字组成的数组,返回可以设置的符合 24 小时制的最大时间。 最小的 24 小时制时间是 00:00,而最大的是 23:59。 从 00:00 (午夜)开始算起,过得越久,时间越大。 以长度为 5 的字符…

校验json格式_格式化展示,校验错误,编辑JSON,这几个JSON工具一定不能错过

今天给大家介绍几个常用JSON的工具,基本上能满足你工作中对JSON的所有需求google插件 JSONView安装好插件后,格式化接口返回的JSON,还能展开节点和关闭节点,超级方便格式化本地JSON,检验错误JSON Viewer网页版将杂乱的…

LeetCode 929. 独特的电子邮件地址

1. 题目 每封电子邮件都由一个本地名称和一个域名组成,以 符号分隔。 例如,在 aliceleetcode.com中, alice 是本地名称,而 leetcode.com 是域名。 除了小写字母,这些电子邮件还可能包含 ‘.’ 或 ‘’。 如果在电…

推荐系统常用评价指标和代码实现

评价指标 Recall 名称: 召回率(真阳性率) 意义:在推荐系统中,我们只关心正确推荐的有多少,也就是用户真实喜欢的,并不会关心推荐错的,所以我们用召回率,而不是准确率&a…

哥谈的是语言,不是寂寞

经常看到一些文章在谈论语言,例如“哪个语言更有前途”,“语言选择是否关键”。我是个语言粉丝,但是看到这些文章总有一些奇怪的感觉。因为在我看来,这些文章谈的东西都不是我眼中的语言——可能与国内技术环境有关,语…