ML.NET Cookbook:(5)如何查看中间过程数据?

通常,当我们构建实验时,我们希望确保“到某一时刻”的数据处理产生我们想要的结果。对于ML.NET来说,这不是很容易做到的:因为所有的ML.NET操作都是延迟执行的,所以我们构造的对象只是数据的“承诺”。

我们需要创建游标并扫描数据以获得实际值。一种方法是使用模式理解[1]并将数据映射到用户定义的IEnumerable对象中。

另一种允许您检查中间数据的机制是GetColumn<T>扩展方法。它允许您以IEnumerable的形式查看一列数据的内容。

以下是所有这些操作:

示例文件[2]:

Label Workclass education marital-status
0 Private 11th Never-married
0 Private HS-grad Married-civ-spouse
1 Local-gov Assoc-acdm Married-civ-spouse
1 Private Some-college Married-civ-spouse
// 将数据加载到数据视图中。
var data = mlContext.Data.LoadFromTextFile<InspectedRow>(dataPath,// 文件的第一行是标题,而不是数据行。hasHeader: true
);// 开始创建我们的处理管道。现在,让我们把所有的文本列连接在一起。
var pipeline = mlContext.Transforms.Concatenate("AllFeatures", "Education", "MaritalStatus");// 转换数据。
var transformedData = pipeline.Fit(data).Transform(data);// “transformedData”是数据的“承诺”。让我们实际加载它。
var someRows = mlContext// 转换为用户定义类型的可枚举项。.CreateEnumerable<InspectedRowWithAllFeatures>(transformedData, reuseRowObject: false)// 取几个值作为数组。.Take(4).ToArray();// 提取“AllFeatures”列。这将取出整个数据集:确保只取几行,以防数据集太大。与静态API类似,只是您必须指定列名和类型。
var featureColumns = transformedData.GetColumn<string[]>(transformedData.Schema["AllFeatures"])

参考资料

[1]

模式理解: https://github.com/dotnet/machinelearning/blob/main/docs/code/SchemaComprehension.md

[2]

示例文件: https://github.com/dotnet/machinelearning/blob/main/test/data/adult.tiny.with-schema.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/302122.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在线交友背后的数学原理

全世界只有3.14 % 的人关注了数据与算法之美欣赏 TED-Ed 带字幕视频, 或者看下面编写的文字版. 01交友网站的背后是算法帝国大家好&#xff0c;我叫 Christian Rudder,我是 OKCupid 网站的创办人之一。这个网站现在已经是全美最大的交友网站。就象这网站上大多数其他人一样,我…

C语言删掉无关变量无输出,C语言变量类型与输出控制用法实例教程

本文实例讲述了C语言变量类型与输出控制用法&#xff0c;有助于读者很好的对其进行总结与归纳。该实例分享给大家供大家参考借鉴之用。具体如下&#xff1a;完整实例代码如下&#xff1a;/************************************************《Beginning C 4th Edition》Notes c…

你不得不知道的Visual Studio 2012(3)- 创建Windows应用程序

创建项目 在Visual Studio中创建一个应用程序&#xff0c;应首先创建一个项和一个解决方案。在此示例中&#xff0c;您将创建Windows presentation foundation应用程序。 创建 WPF 项目 在菜单栏上&#xff0c;依次选择 *** 文件 ***&#xff0c;新建&#xff0c;项目。 选择V…

关于.NET微服务最热门的问题解答

点击蓝字关注我们在我们最近让我们一起学习 .NET的微服务专场活动中&#xff0c;我们收到了一些很好的问题。我们在现场已经回答很多问题&#xff0c;但我们想继续回答一些在会议中出现的最热门的问题。如果你错过了现场直播&#xff0c;不要担心&#xff0c;因为你可以按需观看…

超级智能玩具《小小机器人》|全新50种玩法,创造力之源

致砖《小小机器人》全新套装电动机械的完美结合先来看看视频过过眼瘾吧来自美国STEAM教育让孩子跨学科学知识积木向来是STEAM教育很重要的一部分&#xff0c;因为它涉及到了多种学科&#xff1a;要搭建得稳固——这是工程学&#xff1b;要精准搭建——这是数学&#xff1b;要外…

链表归并成递减c语言,将两个递增的单链表合并为一个递减的单链表

问题描述&#xff1a;假设有两个按元素值递增次序排列的线性表&#xff0c;均以单链表形式存储。请编写算法将这两个单链表归并为一个按元素值递减次序排列的单链表&#xff0c;并要求利用原来两个单链表的结点存放归并后的单链表。问题解答&#xff1a;算法思想&#xff1a;两…

强烈推荐!孩子的科普从这套全球畅销250万册的最酷科学书起步

在马斯的学生时代的记忆中&#xff0c;数学定义定理、化学方程式、物理公式……这些科学知识点总是冷冰冰的&#xff0c;枯燥、深奥也总是科学的代名词。如今教育局明确规定科学课是小学必修课&#xff0c;孩子也逐步接受科学知识的熏陶。但科学课上冷冰冰的&#xff0c;枯燥、…

技术分享|手机推送原理剖析指南

源宝导读&#xff1a;本文旨在对手机推送原理进行剖析和阐述&#xff0c;对业务开发做一些方向性的解惑。一、手机推送的基本概念 ——什么是手机推送&#xff1f;百度词条&#xff1a;手机推送服务是指服务器 定向将信息实时送达手机的服务词条中有2组概念&#xff1a;第一组是…

IO控制命令

ioctl 控制套接字IO行为&#xff0c;获取套接字未决IO的信息。 向套接字发送ioctl命令的函数有两个 一个是源于winsock1 的 ioctlsocket 另一个是 winsock2 新引进的 WSAIoctl ioctl的常用命令&#xff1a; FIONBIO:将套接字设置于非阻塞模式 FIONREAD&#xff1a;返回套接字上…

闽高校计算机二级c语言模拟器,闽高校计算机二级C语言模拟卷及答案.doc

闽高校计算机二级C语言模拟卷及答案.doc (54页)本资源提供全文预览&#xff0c;点击全文预览即可全文预览,如果喜欢文档就下载吧&#xff0c;查找使用更方便哦&#xff01;9.90 积分&#xfeff;一、单项选择题(每小题2分&#xff0c;共20分)1.以下4组用户定义标识符中&#xf…

重磅!中国最赚钱的公司,要上市了!

全世界只有3.14 % 的人关注了数据与算法之美12月31日&#xff0c;中国烟草子公司中烟国际&#xff08;香港&#xff09;神秘地向香港交易所递交了IPO的材料&#xff0c;赶上了2018年的末班车。嫡子上市&#xff0c;中国烟草自己向众人掀起了裙裾一角。过去三年&#xff0c;中烟…

浅谈VS2012单元测试

1、先建一个工程此工程带有待测试的方法 2、在解决方案中建立单元测试 3、在测试项目中添加测试项目的引用 4、写测试用例 namespace UnitTestProject1 {[TestClass]public class UnitTest1{[TestMethod]public void TestMethod1(){var restClient (IRestClient)new JsonServi…

我写代码时的小倔强

分享自己写代码时的好习惯&#xff0c;让你的编程能力突飞猛进&#xff01;大家好&#xff0c;我是鱼皮&#xff0c;上回说到&#xff0c;很多同学在学编程时不注重代码质量&#xff0c;养成坏习惯的同时&#xff0c;失去了提升自己编程能力的机会。还没读上篇文章的同学&#…

c语言管理系统信息以文件保存,求大神给一份能用的c语言的学籍管理系统:且能进行文件保存...

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼#include#include#pragma comment(lib,"libmysql.lib")void showmenu(){system("cls");prinft("\n\n\n\n\n");prinft("\t ┏━━━━━━━━━━━━━━━━━━━━━━━┓ \n");prin…

10个舍不得删的高质量公号

全世界有3.14 % 的人已经关注了数据与算法之美在信息爆炸的时代快节奏的生活里 你是否曾有一瞬间觉得忙碌而空虚&#xff1f;以下10个优质公众号能让你在闲暇的时候不断的提升自我&#xff0c;拓宽视野愿以书卷气&#xff0c;行我路千里历史学资讯ID&#xff1a;tongbanlishi▲…

数据初始化

成员初始化&#xff1a;java保证所有变量在使用前必须初始化。对于方法的局部变量&#xff0c;java以编译时错误的形式来保证&#xff0c;所以如果写成&#xff1a;void f(){int i;i; //Error.. i not initialized}会得到一条错误信息&#xff0c;告诉你i 可能尚未初始化。当然…

ML.NET Cookbook:(7)如何训练回归模型?

通常&#xff0c;为了在ML.NET中训练任何模型&#xff0c;您将经历三个步骤&#xff1a;弄清楚训练数据如何以IDataView形式进入ML.NET。将“学习管道”构建为一系列基本的“运算符”&#xff08;估计器&#xff09;。在管道上调用Fit以获得经过训练的模型。示例文件[1]:featur…

android动画送礼物,Android仿直播类app赠送礼物功能

直播界面实现的是播放本地的视频文件&#xff1a;/*** 直播界面&#xff0c;用于对接直播功能*/public class LiveFrag extends Fragment {private ImageView img_thumb;private VideoView video_view;NullableOverridepublic View onCreateView(NonNull LayoutInflater inflat…

一张纸一幅图,竟然提高了10倍的学习和工作效率!?

人类大脑的容量远远超出一般人的想象&#xff0c;时到21世纪的今天&#xff0c;我们对大脑的运用远远不够。大脑机能的使用率基于我们的思维模式&#xff0c;而思维导图正是开发大脑中最有效的利器&#xff01;之前小木给大家推荐了一套基于少儿大脑思维开发的书籍——东尼博赞…

ftp 使用

先假设有一FTP服务器&#xff0c;FTP服务器&#xff1a;qint.ithot.net&#xff0c;用户名&#xff1a;username 密码&#xff1a;user1234。在本地电脑D&#xff1a;盘创建一个文件夹"qint"。将要上传的文件复制到d:\qint里。通过FTP命令将文件从本地上传&#xf…