005.FashionMNIST数据集简介

一、FashionMNIST数据集简介

FashionMNIST数据集,作为经典的MNIST数据集的现代替代品的数据集,是衣物分类数据集,由Zalando(一家德国的在线时尚零售商)发布。

  • FashionMNIST数据集和MNIST相比。图片尺寸相同,数据量相同,也同样是10分类,是MNIST的困难版本。

在这里插入图片描述

  • 该数据集含有10种类别,共70000个灰度图像。包含60000个训练集样本, 和10000个测试集样本。
  • 每张图像以28x28像素的分辨率提供。

二、数据大小

由于每张图像都是单通道灰度图,因此每个像素可以用一个字节(0-255)来表示。所以,计算单个图像的大小:28像素 x 28像素 = 784字节。

算出整个数据集的大小:

  • 训练集大小:60,000张 x 784字节 = 47,040,000字节(约44.77MB)
  • 测试集大小:10,000张 x 784字节 = 7,840,000字节(约7.48MB)

总的来说,FashionMNIST数据集大约占用52.25MB的磁盘空间。这个值实际上可能略有不同,取决于存储文件的格式(例如压缩,pytorch下载的压缩包仅26M)。

三、十分类

FashionMNIST包含以下10个类别:

  1. T-shirt/top (T恤/上衣)
  2. Trouser (裤子)
  3. Pullover (套头衫)
  4. Dress (连衣裙)
  5. Coat (外套)
  6. Sandal (凉鞋)
  7. Shirt (衬衫)
  8. Sneaker (运动鞋)
  9. Bag (包包)
  10. Ankle boot (踝靴)

四、获取方式

Python中最简单的获取方式是通过使用torchvisiontensorflow.keras.datasets等库,如下是用torchvision获取FashionMNIST的一个示例代码:

from torchvision.datasets import FashionMNIST
from torchvision.transforms import ToTensor# 加载FashionMNIST数据集
train_data = FashionMNIST(root='./dataset/', train=True, transform=transforms.ToTensor(), download=True)
test_data = FashionMNIST(root='./dataset/', train=False, transform=transforms.ToTensor(), download=True)
  • 注意: 这里设置的是默认会从"./dataset/"目录加载FashionMNIST数据集,如果没有则会自动下载。第一次运行时download要设成True,如果已下载过,后续可以设置成False。

五、观察数据

# 显示一下第一张图片
plt.imshow(train_data[0][0].squeeze(),cmap=plt.cm.binary)

在这里插入图片描述

# 显示一下前100张图片
plt.figure(figsize=(10,10))
for i in range(10*10):## 在当前图下生成子图 5*5个图plt.subplot(10,10,i+1)plt.xticks([])plt.yticks([])plt.imshow(train_data[i][0].squeeze(), cmap=plt.cm.binary)

在这里插入图片描述

了解完数据后,我们开始盘他。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/23958.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后端 excel的导入

后端 excel导入 Apache POI 和 EasyExcel 是 Java 中常用的处理 Excel 文件的库。 EasyExcel 是阿里巴巴开源的一款专门针对大数据量 Excel 导入导出场景的工具,其设计目标在于简化开发、减少内存占用并提升处理速度。 以下是使用 EasyExcel 进行 Excel 导入的基本…

混凝土结构中最小配筋率45ft/fy怎么来的?

文章目录 0. 背景1. 原理解析2. 总结 0. 背景 上学的时候就对混凝土结构规范中关于最小配筋率“ 45 f t / f y 45f_t/f_y 45ft​/fy​”的表述很好奇,今天终于看到解释了。原文来自这里,喜欢的可以关注原作者。 按照原作者的说法,本文的解释…

I P协议

IPv4首部 4个字节的32 bit值以下面的次序传输:首先是 0~7 bit,其次8~15 bit,然后1 6~23 bit,最后是24~31 bit。这种传输次序称作 big endian字节序。由于TCP/IP首部中所有的二进制整数在网络中传…

简单聊聊大数据分析的方法有什么

大数据分析是指对规模巨大的数据集合进行的分析过程。 这些数据集合通常具有以下几个特点,可以概括为5个V: 1.数据量大(Volume):大数据分析处理的数据量巨大,远远超出了传统数据处理软件的能力范围。 2.…

攻防世界testre做法(考点:base58)

在做这道题目之前,我们先来简单了解一下base64加密和base58加密,先来说一些预备知识,bit为1个位,即一个0或1,八个位组成一个字节,即八个二进制数。 base64编码原理:1,在使用base64加…

走进 Apache 世界的另一扇大门

引言 作为热爱技术的你,是否也羡慕 Apache PMC 或者 Committer,此篇文章渣渣皮带你迈出如何成为技术大牛的第一步。 当然我现在还是一枚小小的 code contributor,在成为 committer 的路上还在奋力打码中,写这篇文章也是为大家有…

MyBatis 入门详解

一、简介 1. 什么是 MyBatis MyBatis 是一款优秀的持久层框架,它支持自定义 SQL、存储过程以及高级映射。MyBatis 消除了几乎所有的 JDBC 代码和手动设置参数以及获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原生类型、接口和 Java 的 POJO&…

Windows搭建apache网站

1、官网下载安装包,注意下载服务器对应操作系统的安装包(此案例为64位操作系统) Apache VS17 binaries and modules downloadFor (business) webmasters, developers and home-users who want running always up to date Windows VS17 binar…

【机器学习】机器学习与智能交通在智慧城市中的融合应用与性能优化新探索

文章目录 引言机器学习与智能交通的基本概念机器学习概述监督学习无监督学习强化学习 智能交通概述交通流量预测交通拥堵管理智能信号控制智能停车管理 机器学习与智能交通的融合应用实时交通数据分析数据预处理特征工程 交通流量预测与优化模型训练模型评估 智能信号控制与优化…

pycharm安装openai报错

解决方案: Rust官网:http://rust-lang.org 下载安装包,下载后如下 双击这个exe文件 提示需要安装visual studio选择1进行安装即可。安装完成后会自动进行下一步 选择1进行安装 默认安装到C:\Users\用户名文件夹下 验证是否安装成功 由于这两个文件夹占…

k8s:实现一个pod两个容器

# 制作两个容器的镜像 通过以下Dockerfile创建一个镜像 cd /chz/install/docker vim Dockerfile <<<< 内容如下&#xff1a; FROM centosRUN sed -i -e "s|mirrorlist|#mirrorlist|g" /etc/yum.repos.d/CentOS-* RUN sed -i -e "s|#baseurlhttp:/…

Spring Boot框架基础

文章目录 1 Spring Boot概述2 Spring Boot入门2.1 项目搭建2.2 入门程序 3 数据请求与响应3.1 数据请求3.2 数据响应 4 分层解耦4.1 三层架构4.2 控制反转4.3 依赖注入 5 参考资料 1 Spring Boot概述 Spring是Java EE编程领域的一个轻量级开源框架&#xff0c;是为了解决企业级…

Python 机器学习 基础 之 处理文本数据 【处理文本数据/用字符串表示数据类型/将文本数据表示为词袋】的简单说明

Python 机器学习 基础 之 处理文本数据 【处理文本数据/用字符串表示数据类型/将文本数据表示为词袋】的简单说明 目录 Python 机器学习 基础 之 处理文本数据 【处理文本数据/用字符串表示数据类型/将文本数据表示为词袋】的简单说明 一、简单介绍 二、处理文本数据 三、用…

Python怎么使用参数?例如写一个脚本,读取另一个文件里的参数。

在Python中&#xff0c;你可以使用多种方式读取文件并获取其中的参数。一种常见的方法是使用argparse库来处理命令行参数&#xff0c;但这并不是直接从文件中读取参数。若你想从一个文本文件中读取参数&#xff0c;你需要使用文件读取和解析技巧。 假设你有一个参数文件&#x…

IDEA2023.1.4配置springboot项目

新建“Spring Initializr”项目 勾选以下三个依赖项即可。 springboot分为代码层、资源层和测试层。 代码层 根目录&#xff1a;src/main/java 入口启动类及程序的开发目录。在这个目录下进行业务开发、创建实体层、控制器层、数据连接层等。 资源层 根目录&#xff1a;src…

喜讯!云起无垠入选《LLM驱动数字安全2024—AI安全系列报告》

近日&#xff0c;国内领先的数字化领域第三方服务机构数世咨询&#xff0c;发布了《LLM驱动数字安全2024—AI安全系列报告》。该报告深入统计分析了国内在LLM研发或应用方面具有实力的数字安全供应商&#xff0c;并通过报告和雷达图的形式&#xff0c;直观展示了这些供应商在数…

vue2的form利用插槽修改错误提示UI

1. 需求 很多时候我们使用el-form想修改下错误提示的UI&#xff0c;比如table中使用form校验这类场景下错误提示的UI调整就非常重要。 2. 了解文档 Form-Item Scoped Slot name说明error自定义表单校验信息的显示方式&#xff0c;参数为 { error } 3.实际使用 html里使用…

抽象,自定义函数,递归

6.1懒惰是一种美德 如果你 在一个地方编写了一些代码&#xff0c;但需要在另一个地方再次使用&#xff0c;该如何办呢&#xff1f; 假设你编写了一段代码&#xff0c;它计算一些斐波那契数&#xff08;一种数列&#xff0c;其中每个数都是前两个数的和&#xff09;。 现在的…

c# 身份证信息验证

1、返回结果 {"check": false,"info": {"Province": "北京市","City": "市辖区","Area": "东城区","Sex": "女","Birthday": "2000-01-01 00:00:00&quo…

C语言习题~day30

下面哪个不是预定义符号&#xff1f;&#xff08; &#xff09; A.__FILE__ B.__TIME__ C.__DATE__ D.__MAIN__ 前三个是常用宏&#xff0c;分别是&#xff1a;打印所在文件、打印编译时间、打印编译日期。除此之外&#xff0c;还有__LINE__&#xff08;行号&#xff09;、…