评估在线不平衡学习的PAUC

评估在线不平衡学习的PAUC

原始论文《Prequential AUC: properties of the area under the ROC curve for data streams with concept drift》
由于正常的AUC需要计算整体数据集上,每个数据的预测置信度的排名。那么我们首先要求我们的在线学习算法在进行预测时也返回预测为某个类别的概率数值,并将其限制为二分类。

然后再在每个例子后使用一个特殊的排序结构结合滑动窗口遗忘机制来增量计算AUC。因为我们无法记得所有的例子,无法按照AUC的原始计算方式来对所有实例排序。为了使AUC在计算上可行并适用于不断发展的概念,必须使用滑动窗口进行计算。分数的滑动窗口将分析限制在最新的数据上,但要计算AUC,必须对分数进行排序。为了有效地维护一组排序的分数,我们建议使用红黑树数据结构。

伪代码为:

在这里插入图片描述

具体的文字描述为:

  • 对于每个传入的标记示例,分类器分配给该示例的分数被插入到窗口(第15行)以及红黑树(第10行)中,如果已经超过示例窗口,则删除最旧的分数(第5行和第15行)
  • 红黑树根据分数以降序排序,如果分数在负数之前是正数,则根据到达时间以升序排序。通过这种方式,我们保持了一个便于计算AUC的结构,并确保滑动窗口中最旧的分数将在红黑树中被及时找到。
  • 在滑动窗口和树已经被更新之后,通过对在每个阴性示例之前出现的阳性示例的数量求和(第18-28行)并通过所有可能的对pn(第29行)将该值归一化来计算AUC,其中p是窗口中阳性的数量,并且n是阴性的数量。
  • 在第26行中,我们通过减少AUC的增量来考虑阳性和阴性示例之间的分数关系。

例子如下图所示:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

窗口W包含六个例子,所有这些例子都已经插入到红黑树中。如前所述,树中的示例根据得分s降序排序(深度优先搜索),肯定在否定之前,并且根据到达时间t升序排序。当一个新的实例被分类器评分时(t:7,l:+,s:0.80),最旧的实例(t:1)将从窗口和树中删除。在插入新的评分示例之后,通过以深度优先搜索方式遍历树并对算法1的第17-29行中呈现的标签进行计数来计算AUC。

并且经过实验证明,随时间平均的序贯AUC与在整个流上计算的AUC高度一致且具有显著判别性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/124094.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flume 快速入门【概述、安装、拦截器】

文章目录 什么是 Flume?Flume 组成Flume 安装Flume 配置任务文件应用示例启动 Flume 采集任务 Flume 拦截器编写 Flume 拦截器拦截器应用 什么是 Flume? Flume 是一个开源的数据采集工具,最初由 Apache 软件基金会开发和维护。它的主要目的是…

Java 谈谈你对OOM的认识

文章目录 前言一、基础架构二、常见OOM1、栈内存溢出java.lang.StackOverflowError2、堆内存溢出java.lang.OutOfMemoryError:Java heap space3、GC回收时间过长java.lang.OutOfMemoryError: GC overhead limit exceeded4、NIO程序堆外内存溢出java.lang.OutOfMemor…

H 指数 II

给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数,citations 已经按照 升序排列 。计算并返回该研究者的 h 指数。 h 指数的定义:h 代表“高引用次数”(high citations)&#xff…

STM32———USART串口控制LED灯亮灭

1.硬件设计流程 2.程序设计流程 1.串口初始化时钟使能:RCC_APBxPeriphClockCmd(); GPIO初始化时钟使能:RCC_AHBxPeriphClockCmd();2.GPIO端口模式配置:GPIO_Init();3.串口参数初始化:USART_Init();4.串口使能:USART_C…

SpringBoot相比于Spring的优点(自动配置和依赖管理)

自动配置 例子见真章 我们先看一下我们Spring整合Druid的过程,以及我们使用SpringBoot整合Druid的过程我们就知道我们SpringBoot的好处了。 Spring方式 Spring方式分为两种,第一种就是我们使用xml进行整合,第二种就是使用我们注解进行简化…

RedissonCach的源码流程

上: https://blog.csdn.net/Michelle_Zhong/article/details/126384566 中: https://blog.csdn.net/michelle_zhong/category_11874153.html 下: https://blog.csdn.net/Michelle_Zhong/article/details/126391915?ops_request_misc%257B%…

AAOS CarMediaService 问题分析

文章目录 问题描述车载蓝牙音乐流程Music 监听焦点变化流程BT请求焦点的流程MediaSession 服务端的流程BT和music 之间的相互影响 问题描述 问题 AAOS界面连接蓝牙的情况下,Music应用播放音乐会暂停。 分析 暂停是应用的行为,Music应用会监听focus的变化…

GE IS420UCSBH1A 控制器模块

控制器模块是工业自动化和控制系统中的关键组件,用于监测、控制和管理各种工程过程。这些模块通常具有以下特点: 多通道控制: 控制器模块通常可以控制多个通道,允许同时管理多个设备或过程。 实时控制: 模块支持实时控…

docker 启动简单的开发环境(mysql, redis, etcd)

docker开启容器分为两种,一种是命令启动,一种是用yaml启动 本片文章用到的是yaml启动 以下是启动脚本:env.yaml version: "3" services:jump_etcd:container_name: jump_etcdimage: bitnami/etcd:3privileged: truevolumes:- &q…

判读文本编码是否为UTF8

&#xff08;----转载-----&#xff0c;忘记出处了抱歉&#xff09; private bool IsUtf8(byte[] buff) { for (int i 0; i < buff.Length; i) { if ((buff[i] & 0xE0) 0xC0) // 110x xxxx 10xx xxxx …

使用NVIDIA GPU FFmpeg转码 YUV to H264(成功)

0. 官方教程 NVIDIA官方教程&#xff1a;链接&#xff0c;本篇内容主要参考2.2 Software Setup。 1. 安装显卡驱动 确保nvidia-smi能够正常使用&#xff1a; 2. 安装CUDA toolkit 注意要与显卡驱动版本对应&#xff0c;验证toolkit是否正确安装&#xff1a; 3. 安装ffnvco…

Pytorch detach()方法

detach() 是 PyTorch 中的一个方法&#xff0c;用于从计算图中分离&#xff08;detach&#xff09;张量。它可以将一个张量从当前计算图中分离出来&#xff0c;返回一个新的张量&#xff0c;该张量与原始张量共享相同的底层数据&#xff0c;但不再追踪梯度信息。 当你需要在计…

代码版本控制工具GitLab :从安装到使用一步到位

一、GitLab 是什么&#xff1f; 如果听说过 Git 或者 GitHub&#xff0c;那么 GitLab 你一定也听说过。GitLab 是一个用于仓库管理系统的开源项目&#xff0c;使用 Git 作为代码管理工具&#xff0c;并在此基础上搭建起来的 Web 服务。简单理解&#xff1a;GitLab 类似私人版 …

ssm框架

SSM框架是一个用于构建Java Web应用程序的集成框架&#xff0c;它由三个关键组件组成&#xff0c;分别是Spring、Spring MVC、和MyBatis&#xff0c;这三个组件的作用如下&#xff1a; Spring&#xff08;Spring Framework&#xff09;&#xff1a;Spring是一个轻量级的开源框架…

计算机毕业设计选题推荐-社区志愿者服务微信小程序/安卓APP-项目实战

✨作者主页&#xff1a;IT毕设梦工厂✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Py…

Transformers实战(二)快速入门文本相似度、检索式对话机器人

Transformers实战&#xff08;二&#xff09;快速入门文本相似度、检索式对话机器人 1、文本相似度 1.1 文本相似度简介 文本匹配是一个较为宽泛的概念&#xff0c;基本上只要涉及到两段文本之间关系的&#xff0c;都可以被看作是一种文本匹配的任务&#xff0c; 只是在具体…

【表面缺陷检测】铝型材表面缺陷检测数据集介绍(含xml标签文件)

一、铝型材介绍 铝型材是一种由铝合金材料制成的&#xff0c;具有固定截面形状和尺寸的条形建材。由于其优良的物理性能和广泛的应用领域&#xff0c;铝型材在现代工业和生活中发挥着重要的作用。 1、铝型材的分类 根据截面形状的不同&#xff0c;铝型材可分为角铝、槽铝、工…

frp内网穿透教程搭建0.52.3版本

网上很多关于frp的教程都是04 03版本的了&#xff0c;都是配置的ini文件&#xff0c;现在都改成toml文件了&#xff0c;下面基本上都是官方文档的简单copy&#xff0c;细节推荐打开去看中文版的文档介绍&#xff08;地址放在最后了&#xff09;。下面简单介绍几个 为什么使用 …

CAN接口的PCB Layout规则要求汇总

随着时代高速发展&#xff0c;控制器局域网&#xff08;CAN&#xff09;接口的应用越来越广泛&#xff0c;尤其是在汽车电子、航空航天等领域中发挥着重要作用&#xff0c;为了确保CAN接口的可靠性和稳定性&#xff0c;工程师必须在其PCB Layout方面下功夫&#xff0c;下面来看…

【题解】[GenshinOI Round 3] P9816 少项式复合幂

题目链接 分析 首先这题给了很大的提示信息 注意 m 和 p 的范围 , 很自然的想到可以先把所有可能的 f ( x ) f(x) f(x) 算出来. 思维误区 有些人在算完 f ( x ) f(x) f(x) 之后可能就会去思考找环的问题&#xff0c;然后一些码力弱的大佬就会祭掉. 在经过仔细的观察之后…