ML.NET 0.9特性简介

ML.NET 0.9已于上周发布,距离上次0.8版本的发布只有一个多月,此次增加的新特性主要包括特征贡献计算,模型可解释性增强,ONNX转换对GPU的支持,Visual Studio ML.NET项目模板预览,以及API改进。

特征贡献计算

特征贡献计算(Feature Contribution Calculation)通过决定每个特征对模型分数的贡献,从而显示哪些特征在对特别个体的数据样本的模型预测最有影响力。

当你面临历史数据中有许多特征时而又想选择使用最重要的特征时,特征贡献计算显得十分重要。因为使用太多的特征(尤其是包含对模型没有影响的特征)会减少模型的性能与准确性。因此,使用特征贡献计算你可以从原始特征集中识别最有影响力的正向与负向的贡献。

示例代码:

// 创建特征贡献计算器
// 对已有训练模型参数的所有特征进行计算贡献
var featureContributionCalculator = mlContext.Model.Explainability.FeatureContributionCalculation(model.Model, model.FeatureColumn, numPositiveContributions: 11, normalize: false);
// FeatureContributionCalculatingEstimator可被用作管道中的一个步骤
// 被FeatureContributionCalculatingEstimator保存的特征将在FeatureContribution列中
var pipeline = mlContext.Model.Explainability.FeatureContributionCalculation(model.Model, model.FeatureColumn, numPositiveContributions: 11).Append(mlContext.Regression.Trainers.OrdinaryLeastSquares(featureColumn: "FeatureContributions"));

输出结果可下:

The output of the above code is:Label   Score   BiggestFeature         Value   Weight   Contribution24.00   27.74   RoomsPerDwelling        6.58    98.55   39.9521.60   23.85   RoomsPerDwelling        6.42    98.55   39.0134.70   29.29   RoomsPerDwelling        7.19    98.55   43.6533.40   27.17   RoomsPerDwelling        7.00    98.55   42.52

对于特征选取的模型可解释性的增强

除了特征贡献计算之外,排列特征重要性(PFI)与广义加性模型(GAM)也有加强。

  • 排列特征重要性支持大多数学习任务:回归,二元分类,多元分类与排序。

  • 排列特征重要性允许你在特征重要性分数上计算置信区间,以便可以得到更好的平均值估计。

  • 广义加性模型支持特征贡献计算,以便你可以迅速看到哪些特征驱动个体的预测。

增加对ONNX转换的GPU支持

640?wx_fmt=png

在ML.NET 0.9中通过集成高性能的ONNX运行时库添加了使用激活GPU的CUDA 10.0运行ONNX模型的功能。ONNX模型的GPU支持现在已经可以在Windows 64位系统上使用,不久之后将支持Linux与Mac系统。

新的Visual Studio ML.NET项目模板预览

Visual Studio项目模板现在推出了支持ML.NET的预览版本。下载地址

640?wx_fmt=png

模板涵盖以下场景:

  • ML.NET控制台应用程序

  • ML.NET模型类库

其它API的改进

简化文本数据加载

ML.NET 0.9以前你需要显示的标明列名:

var mlContext = new MLContext();var reader = mlContext.Data.CreateTextReader(new[] {        new TextLoader.Column("IsOver50K", DataKind.BL, 0),        new TextLoader.Column("Workclass", DataKind.TX, 1)},hasHeader: true);var dataView = reader.Read(dataPath);

现在你可以直接使用泛型:

var mlContext = new MLContext();var dataView = mlContext.Data.ReadFromTextFile<InspectedRow>(dataPath, hasHeader: true);private class InspectedRow{[LoadColumn(0)]    public bool IsOver50K { get; set; }[LoadColumn(1)]    public string Workclass { get; set; }
}

获取预测置信因子

通过Calibrator Estimators,除了在评估模型质量时可以获得分数列之外,还可以得到置信因子。

例如,你可以获得每个预测值的概率:

Score - 0.458968    Probability 0.4670409
Score - 0.7022135   Probability 0.3912723
Score 1.138822      Probability 0.8703266

新的键-值匹配估测器及转换

新特性替换了TermLookupTransform,同时提供了指定值之间匹配的新方法。你可以指定键列与值列的匹配关系,但需保证两者数量一致。

其它的改进与变化

  • 允许ML.NET在Windows Nano容器及Windows机器上运行,而无需安装Visual C++运行时。

  • 在包含模型信息的DataView构造器中提供元数据支持,比如被编码为元数据的评估指标可以通过代码解析出来,由此能够使用任何工具进行可视化。

原文地址:https://www.cnblogs.com/kenwoo/p/10284906.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com

640?wx_fmt=jpeg


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/317705.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[学习笔记] 初次见面,请多关照 (公式推导+题集)——杜教筛

筛积性函数的前缀和常见积性函数公式推导狄利克雷卷积杜教筛实现常见卷积习题集Sum神犇和蒟蒻简单的数学题常见积性函数 μ\muμφφφd(n)d(n)d(n)&#xff1a;nnn的约数个数σ(n)σ(n)σ(n)&#xff1a;nnn的约数和ϵ(n)ϵ(n)ϵ(n)&#xff1a;单位元函数&#xff0c;e(n)[n1…

51nod-动物与游戏【树链剖分,线段树】

正题 题目链接:http://www.51nod.com/Contest/Problem.html#contestProblemId3957 题目大意 nnn个点的一棵树&#xff0c;第iii个节点上的动物有ai100\frac{a_i}{100}100ai​​的概率加入&#xff0c;每个加入的动物都会每秒向父节点移动。 对于第iii只动物&#xff0c;如果它…

cf 1504 F. Flip the Cards

F. Flip the Cards 题意&#xff1a; 这个题你也可以看看&#xff0c;就是一个卡片正反两个数&#xff0c;n个卡片在桌子上摆好&#xff0c;你可以任意移动卡片的位置&#xff0c;也可以翻转卡片&#xff08;翻转一次消耗1点&#xff09;&#xff0c;最终使得卡片的正面为升序…

10.31模拟:总结

前言 220pts 201001000 好的地方是没有挂分吧 但是后两个小时一直在摆烂… 做关于序列的题实在是太弱了qwq T4仔细想想应该能出来的 是比较简单的题 考场 先看题 T1看了就头疼 T2把二分写脸上了&#xff0c;似乎很水的样子&#xff08;bush&#xff09; T3字也忒多了… T4感…

AOP 还在配置吗改用打标签模式吧!

为什么我喜欢打标签来配置AOP1. 配置多很混乱&#xff0c;代码里面很难分辨出来哪些是AOP容器(比如属性注入)2. 对于代码生成器生成的代码里面还需要手动加到配置里面3. 连java spring现在都是清一色的注解来代替xml&#xff0c;这个就是趋势所在我基于Autofac开发了一个基于标…

DZY Loves Math IV(杜教筛)

文章目录titlesolutioncodetitle solution 这道题是多么的妙啊&#xff0c;完全不是我能推出来的式子呢&#xff01; 观察数据范围&#xff0c;有点奇怪欸&#xff0c;在暗示我&#xff1f;&#xff1f; 考虑暴力枚举nnn S(n,m)∑i1mφ(ni)S(n,m)\sum_{i1}^mφ(n\times i)S…

codeforces:CF1604 总结

前言 solve&#xff1a;4 rank&#xff1a;48&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; 这排名我不理解了 solve4真真不算多啊… 而且前四题感觉也不算太难… 仔细看了看榜 哦… 因为这次…

IdentityServer4直播

大家好&#xff0c;很久没有更新公众号&#xff0c;让各位久等了&#xff0c;主要是最近出除了工作之外&#xff0c;一直私下在学习和研究IdentityServer4&#xff0c;后续会腾出一部分时间陆续更新公众号。对于IdentityServer4(简称IDS)&#xff0c;网上的资料少之可怜&#x…

P7988-[USACO21DEC] HILO G【set,线段树】

正题 题目链接:https://www.luogu.com.cn/problem/P7988 题目大意 给出一个长度为nnn的排列&#xff0c;开始有一个数字xxx&#xff0c;第一次询问回答x<a1x<a_1x<a1​&#xff08;记为LOLOLO&#xff09;或者x>a1x>a_1x>a1​&#xff08;记为HIHIHI&#…

Codeforces Round #712 (Div. 2)

题号题目知识点质量1504ADj Vu思维题1504BFlip the Bits贪心1504CBalance the Bits构造题1504D3-Coloring思维题&#xff0c;构造题1504ETravelling Salesman Problem思维题好题啊1504FFlip the Cards贪心&#xff0c;思维题现在还没搞明白&#xff0c;不错的思维题 A~D题解代码…

[AH2017/HNOI2017]礼物

Description 我的室友最近喜欢上了一个可爱的小女生。马上就要到她的生日了&#xff0c;他决定买一对情侣手 环&#xff0c;一个留给自己&#xff0c;一个送给她。每个手环上各有 n 个装饰物&#xff0c;并且每个装饰物都有一定的亮度。但是在她生日的前一天&#xff0c;我的室…

NOIP2017洛谷P3953:逛公园(分层图最短路、dp、拓扑)

解析 容易想到dp 先跑一遍最短路把每个点的dis求出来 设计dpu,xdp_{u,x}dpu,x​表示结点u多走了x的方案数 dp按照dis升序排列后&#xff0c;从前到后转移即可 如果有0边&#xff0c;求出只有0边时的拓扑序&#xff0c;作为第二关键字进行排序 关于0环&#xff0c;第一篇题解的…

.NET Core 3.0:System.Data的变化

System.Data虽然不引人关注&#xff0c;但在.NET中&#xff0c;System.Data对于各种关系数据库的连接是非常重要的。System.Data也被称为ADO.NET&#xff0c;其前身是ActiveX Data Objects。System.Data提供了通过的框架&#xff0c;在她的基础上.NET数据驱动应用可以被构建。这…

蓝桥杯国赛 皮亚诺曲线距离

参考博客 题意&#xff1a; 题解&#xff1a; 这个很恶魔 本质好说就是找规律&#xff0c;但是贼难写。。 找了篇题解&#xff0c;做法就是大化小&#xff0c;将大阶化为成小阶&#xff0c;计算出离远点的距离。。。我感觉我是写不出来。。 挺秒的&#xff0c;要推公式估计要…

P3369-[模板]普通平衡树【无旋Treap】

正题 题目链接:https://www.luogu.com.cn/problem/P3369 题目大意 一个空可重集&#xff0c;要求支持 插入一个数xxx删除一个数xxx询问一个数xxx的排名询问排名第xxx的数字询问xxx的前驱询问xxx的后继 1≤n≤105,1≤∣x∣≤1071\leq n\leq 10^5,1\leq |x|\leq 10^71≤n≤105…

[SDOI2015]序列统计 (NTT)

Description 小C有一个集合S&#xff0c;里面的元素都是小于M的非负整数。他用程序编写了一个数列生成器&#xff0c;可以生成一个长度为N的数列&#xff0c;数列中的每个数都属于集合S。小C用这个生成器生成了许多这样的数列。 但是小C有一个问题需要你的帮助&#xff1a;给定…

NOIP2016洛谷P1600:天天爱跑步

文章目录解析sol1:树剖mapsol2&#xff1a;树剖离线sol3&#xff1a;dfs维护树状数组差分解析 个人认为本题比同年的逛公园可做许多 本题的一个关键是&#xff1a;把慢跑者(u,v)(u,v)(u,v)转化为上升路径上满足depxtxdepudep_xt_xdep_udepx​tx​depu​的结点和下降路径上满足…

将 Visual Studio 的代码片段导出到 VS Code

导语和原文作者一样&#xff0c;水弟我现在也是使用 VS Code 和 Rider 作为主力开发工具&#xff0c;尤其是 VS Code 可以跨平台&#xff0c;又有丰富的插件支持和多种编程语言支持。当我从 VS 转移到以 VS Code 的开发过程中&#xff0c;遇到的最大问题就是代码提示的不完善&a…

2020 Jiangsu Collegiate Programming Contest

比赛链接 题号题目难易考点Gym 102875AArray难线段树&#xff0c;欧拉降幂Gym 102875BBuilding BlocksGym 102875CCats签到题贪心&#xff0c;思维Gym 102875DDelete Prime中模拟&#xff0c;暴力Gym 102875EEliminate the VirusGym 102875FFlee from MazeGym 102875GGrid Col…

P3835-[模板]可持久化平衡树【无旋Treap】

正题 题目链接:https://www.luogu.com.cn/problem/P3835 题目大意 一个空可重集&#xff0c;要求支持 插入一个数xxx删除一个数xxx询问一个数xxx的排名询问排名第xxx的数字询问xxx的前驱询问xxx的后继 但是所有操作都是基于某个历史版本 1≤n≤5105,1≤∣x∣≤1091\leq n\l…