因果机器学习算法新进展解析

news/2025/10/21 22:27:05/文章来源:https://www.cnblogs.com/codeshare1135/p/19156574

开源因果机器学习算法

我们很高兴宣布,将开源因果机器学习算法,这些算法是某中心多年图形因果模型研究的成果。除了常规的效果估计外,这些算法还能实现各种复杂的因果查询,包括但不限于异常值和分布变化的根因分析、因果结构学习以及因果结构诊断。在内部,这些算法已被某中心从供应链到云服务的多个团队使用。

与某机构合作创建PyWhy

我们同样兴奋地宣布,在与某机构的共同努力下,我们创建了一个名为PyWhy的新GitHub组织。PyWhy作为微软因果机器学习库DoWhy的新家,我们正将算法整合其中。DoWhy是GitHub上最受欢迎的因果性库之一。某中心和某机构很高兴能与DoWhy用户和贡献者社区合作。

图形因果模型

大多数现实世界系统,无论是分布式计算系统、供应链系统还是制造过程,都可以使用可能相互施加因果影响的变量来描述。

以由许多不同Web服务组成的微服务架构为例。网站加载时间增加的原因是什么?是后端数据库缓慢?负载均衡器故障?还是网络速度慢?

现有的因果性库(包括DoWhy)专注于各种类型的效果估计,其总体目标是识别干预对某些目标变量的影响。在微服务架构的情况下,它们有助于回答诸如"如果我在缓存服务配置中进行此更改,会改善网站加载时间还是使其恶化?"等问题。

我们的贡献通过利用图形因果模型(GCM)的力量,补充了DoWhy的现有功能集。GCM是由图灵奖得主Judea Pearl开发的形式化框架,用于建模系统中变量之间的因果关系。GCM的一个关键组成部分是因果图,它直观地表示观察变量之间的因果关系,箭头从原因指向结果。

因果机制与根因分析

因果图中的每个变量都有自己的因果机制,描述其值如何从其父代的值生成。我们可以训练概率模型来学习这些因果机制,并使用它们将异常事件或机制变化归因于特定节点。这种对机制贡献的分解是我们新型根因分析算法的核心思想。

例如,在上述微服务架构中,我们可能意外部署了一个有缺陷的服务,该服务使用次优的SQL查询从数据库获取数据,从而增加了网站延迟。使用我们称为"分布变化归因"的功能,我们可以识别出这个有缺陷的服务。

GCM的广泛应用

但GCM能做更多:它们可用于计算干预效果、估计反事实、计算节点对其后代的直接和内在影响,或将异常归因于潜在的上游根本原因。通过发布我们的算法,我们希望将这些工具提供给更广泛的研究人员和实践者,并帮助推进围绕GCM的科学方法。

PyWhy的长期愿景

对于效果估计,DoWhy已经使用了两个最流行的因果推断科学框架——图形因果模型和潜在结果——并将它们结合在一个库中。通过我们的贡献,我们希望进一步推动框架及其专用研究社区之间的协同作用。

但我们的长期愿景超越了DoWhy、潜在结果和GCM。这体现在我们创建PyWhy的努力以及我们帮助指导这个新GitHub组织方向的承诺中。我们欢迎其他人加入我们的努力,成为社区的一部分。

我们对PyWhy的希望和雄心——如其使命所述——是"构建一个因果机器学习的开源生态系统,推动技术进步,并使其可供实践者和研究人员使用。我们构建和托管可互操作的库、工具和其他资源,涵盖各种因果任务和应用,通过基础因果操作的通用API和对端到端分析过程的关注连接起来。"

加入我们

如果您是研究因果机器学习问题的科学家或对其感到好奇,请访问py-why.github.io/dowhy/gcm了解DoWhy中新的GCM功能,或在github.com/py-why/dowhy上浏览源代码。

如果您是因果机器学习库的所有者,并认为您的库适合PyWhy,请访问github.com/py-why了解这个新组织,或在Discord上与我们交流。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/942729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一键生成爆款文章,并自动发布!

最近在疯狂的玩 n8n,也越来越发现他的强大之处了。 同时也感叹目前的 AI 生态真的很完善,而且 AI 的成果也越来越好了,甚至可以超过很多普通人。 这不,今天刚搭建了一个:一键生成小红书爆款文章,并自动发布的工作…

软件工程作业三

计算机科学与技术 王阿丽亚阿不来海提 3223004639 计算机科学与技术 阿依古再丽艾力
3223004595这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/Class34Grade23ComputerScience这个作业要求在哪里 https:…

1188. 设计有限阻塞队列

1188. 设计有限阻塞队列 题目描述实现一个拥有如下方法的线程安全有限阻塞队列:BoundedBlockingQueue(int capacity) 构造方法初始化队列,其中capacity代表队列长度上限。void enqueue(int element) 在队首增加一个e…

MySQL 创建和授权用户

查看所有用户 SELECT user, host FROM mysql.user;查看指定用户的权限 SELECT * FROM mysql.user WHERE user=root创建和授权用户创建一个用户CREATE USER readonly@% IDENTIFIED BY 123456;给用户赋予只读权限GRANT S…

MySQL分页解决方案

一、深分页问题背景 当分页偏移量(OFFSET)过大时(如LIMIT 100000, 20),MySQL需要扫描并丢弃前100,000条记录,导致:查询性能急剧下降 服务器资源浪费 响应时间变长二、解决方案详解 1. 游标查询(Cursor-based P…

二维坐标旋转公式推导

二维坐标旋转公式一、核心概念 在二维坐标系中,一个点围绕某个旋转中心旋转时,其坐标会发生变化。 旋转可分为两种情况:绕坐标原点 (0,0) 旋转 绕任意点 (cx, cy) 旋转推导基于三角函数与极坐标的关系。二、绕原点 …

Failed to resolve: org.webrtc:google-webrtc:1.0.32006

参考文章:https://blog.csdn.net/rosyrays1/article/details/148427678 这是一个在安卓端实现音视频功能时遇到的问题 解决方案2: gradle dependencies方式: 使用一些开源社区自制仓库的webrtc包名 比如这个(亲测可…

云计算简单算法练习题

云计算简单算法练习题 No1 LCR 128. 库存管理 I 仓库管理员以数组 stock 形式记录商品库存表。stock[i] 表示商品 id,可能存在重复。原库存表按商品 id 升序排列。现因突发情况需要进行商品紧急调拨,管理员将这批商品…

机器学习到深度学习发展历程

一、传统机器学习时代(2000-2012) 这一时期代表了深度学习革命前夕的机器学习黄金时代。支持向量机、决策树集成方法等技术在理论和实践上都达到了成熟,为后续深度学习的发展提供了重要的理论基础和实践经验。 支持…

Java三大特性

OOP 面向对象三大特性:封装、继承、多态、(抽象) 1.封装 只暴露对象的公开属性和方法,无法看到内部实现过程;对象功能内聚,模块之间的耦合降低,更有维护性。 设计模式七大原则之一的迪米特原则,是对封装的具体要…

日总结 15

C# 和 Java 作为两种主流的面向对象编程语言,虽语法相似(均源于 C 系),但在设计目标、生态、特性等方面差异显著,核心区别可总结如下:历史与定位 C#:微软 2000 年推出,早期绑定 Windows 的.NET Framework,后通…

[CF 516 E] Drazil and His Happy Friends

A 侧有 \(n\) 个点,B 侧有 \(m\) 个点,从 \(0\) 开始标号。已知初始有若干黑点,其它都是白点。第 \(i\)(\(i \ge 0\))时刻,若 A 的第 \(i \bmod n\) 个点和 B 的第 \(i \bmod m\) 个点中存在一个黑色的点,则两个…

NVIDIA Triton服务器漏洞危机:攻击者可远程执行代码,AI模型最高权限告急

NVIDIA Triton服务器漏洞危机:攻击者可远程执行代码,AI模型最高权限告急漏洞概述NVIDIA公司面向Windows和Linux系统的Triton Inference Server(一个用于大规模运行人工智能模型的开源平台)近日披露了一组安全漏洞,…

高级程序设计第二次作业

姓名:王志勇 学号:102500434 3.11编程题第一到第八题: 1. 2. 3. 4. 5. 6. 7. 8. 3.1-3.5,3.8-3.9的示例程序结果输出: 3.1 3.2 3.3 3.4 3.5 3.8 3.9

10月21日日记

1.今天进行工程实训,了解机床操作 2.明天学习高数 3.哈希冲突有哪些解决方法?哪种效率最高?

home-assistant.-Adding integrations

Edit the dashboard(编辑仪表板) Dashboards are customizable pages to display information about your smart home devices.Dashboards, cards, and views The screenshot shows an Overview dashboard with man…

lgP14254 分割(divide)

lg scp-s模拟赛T2 场上计数的部分调了很久没过。 主要讲一下场上的思路吧,可能有点乱。 首先可以发现每个节点子树的深度集合可以表示成一个上界和一个下界。 下界是节点本身的深度,上界是节点子树里最深的节点的深度…

idea快捷键和注释、关键字、数据类型

idea快捷键和注释、关键字、数据类型快捷键 psvm:public static void main(String[] args) {} sout:System.out.println(); 注释 单行注释:// 多行注释:/* / 文档注释: /* * * */ 关键字基本数据…

Windows版本的Emacs如何选择字体(Linux也一样,KIMI)

Windows版本的Emacs如何选择字体(Linux也一样,KIMI)TITLE: Windows版本的Emacs如何选择字体(Linux也一样,KIMI) 本文为和AI大模型助手KIMI的对话内容,仅供参考。 Emacs应该如何选择字体? User: Windows版本的E…

2025.10.21

今天上午工程实训课学习激光加工打印名牌和在手机壳上刻字,中午吃了小蛋糕,下午帮学长拿资料,所以早起了一会去教室,晚上吃了水果,然后上养生与健身课。