【深度学习】数据集的划分比例到底是选择811还是712?

1 引入

在机器学习中,将数据集划分为训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)是非常标准的步骤。这三个集合各有其用途:

  • 训练集 (Training Set):用于模型学习参数。训练集越大,理论上模型能学到更多数据模式,但过大可能导致过拟合(如果模型过于复杂)。
  • 验证集 (Validation Set):用于超参数调优、模型选择、提前停止等。不参与模型参数的训练,但用于模型开发过程中的评估。验证集大小影响调优结果的可靠性。
  • 测试集 (Test Set):用于模型开发和调优完成后,对最终模型的最终、无偏见性能评估。测试集大小影响最终评估结果的可靠性。

现在来看 811 和 712 的区别:

  • 811 划分

    • 训练集:80%
    • 验证集:10%
    • 测试集:10%
  • 712 划分

    • 训练集:70%
    • 验证集:10%
    • 测试集:20%

2 主要区别和考量

  1. 训练数据量:

    • 811: 训练集占 80%,提供了更多的样本供模型学习。对于数据量不是特别庞大的情况,更多的训练数据通常能帮助模型学习得更好。
    • 712: 训练集占 70%,比 811 少了 10%。这意味着模型用于学习的数据基础更小。
  2. 验证数据量:

    • 811 和 712 的验证集比例相同 (10%)。在这个比较中,验证集的大小不是主要的区别点。两者提供相同量的样本用于超参数调优和模型选择。
  3. 测试数据量和最终评估的可靠性:

    • 811: 测试集占 10%。测试集较小,最终的模型性能评估结果的随机性(方差)可能相对较高。如果测试集中的样本偶然性较强,最终报告的性能指标可能不够稳定可靠。
    • 712: 测试集占 20%。测试集更大,能提供更稳定、更可靠的最终模型性能评估结果。如果你需要对模型的泛化能力有一个更具信心的估计,或者数据集本身存在较大的类别不平衡或稀有情况,更大的测试集会更有优势,因为它更有可能包含这些情况,从而提供更全面的评估。

总结哪个更好?

同样,没有绝对的“哪个更好”,选择取决于你在训练效率最终评估可靠性之间的权衡:

  • 倾向于 811 划分的情况:

    • 数据集规模相对较小或中等,希望最大化用于模型训练的数据量,以提高模型的潜力。
    • 对最终性能评估结果的精确度和可靠性要求不是极致高。
  • 倾向于 712 划分的情况:

    • 数据集规模较大,即使减少 10% 的训练数据(从 80% 到 70%),训练集仍然足够庞大,足以训练出高性能的模型。
    • 对最终模型性能的评估结果非常重视,需要一个更可靠、更具统计意义的测试集来验证模型的泛化能力(例如,用于学术论文、产品上线前的严谨评估等)。

3 总结

简单来说:

  • 811 更侧重于最大化训练数据,可能有助于提升模型的理论性能上限(尤其在数据量有限时)。
  • 712 更侧重于提高最终评估的可靠性,让你对模型在真实世界数据上的表现更有信心

数据集多无脑选712,数据集没那么多811就完事呐!一般大多数都选择811进行改进,毕竟数据集也没那么多(大概是小于1w张?)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/81013.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mysql刷题 day01

LC 197 上升的温度 需求:编写解决方案,找出与之前(昨天的)日期相比温度更高的所有日期的 id 。 代码: select w2.id from Weather as w1 join Weather as w2 on DateDiff(w2.recordDate , w1.recordDate) 1 where…

鸿蒙OSUniApp 制作个人信息编辑界面与头像上传功能#三方框架 #Uniapp

UniApp 制作个人信息编辑界面与头像上传功能 前言 最近在做一个社交类小程序时,遇到了需要实现用户资料编辑和头像上传的需求。这个功能看似简单,但要做好用户体验和兼容多端,还是有不少细节需要处理。经过一番摸索,总结出了一套…

科技的成就(六十八)

623、杰文斯悖论 杰文斯悖论是1865年经济学家威廉斯坦利杰文斯提出的一悖论:当技术进步提高了效率,资源消耗不仅没有减少,反而激增。例如,瓦特改良的蒸汽机让煤炭燃烧更加高效,但结果却是煤炭需求飙升。 624、代码混…

荣耀手机,系统MagicOS 9.0 USB配置没有音频来源后无法被adb检测到,无法真机调试的解决办法

荣耀手机,系统MagicOS 9.0 USB配置没有音频来源后无法被adb检测到,无法真机调试的解决办法 前言环境说明操作方法 前言 一直在使用的uni-app真机运行荣耀手机方法,都是通过设置USB配置的音频来源才能成功。突然,因为我的手机的系…

D-Pointer(Pimpl)设计模式(指向实现的指针)

Qt 的 D-Pointer(Pimpl)设计模式 1. Pimpl 模式简介 Pimpl(Pointer to Implementation)是一种设计模式,用于将类的接口与实现分离,从而隐藏实现细节,降低编译依赖,提高代码的可维护…

MySQL 8.0 OCP 1Z0-908 101-110题

Q101.which two queries are examples of successful SQL injection attacks? A.SELECT id, name FROM backup_before WHERE name‘; DROP TABLE injection; --’; B. SELECT id, name FROM user WHERE id23 oR id32 OR 11; C. SELECT id, name FROM user WHERE user.id (SEL…

Vue ElementUI原生upload修改字体大小和区域宽度

Vue ElementUI原生upload修改字体大小和区域宽度 修改后 代码 新增的修改样式代码 .upload-demo /deep/ .el-upload-dragger{width: 700px;height: 300px; }原有拖拽组件代码 <!-- 拖拽上传组件 --><el-uploadclass"upload-demo"dragaction"":m…

React和Vue在前端开发中, 通常选择哪一个

React和Vue的选择需结合具体需求&#xff1a; 选React的场景 大型企业级应用&#xff0c;需处理复杂状态&#xff08;如电商、社交平台&#xff09;团队熟悉JavaScript&#xff0c;已有React技术栈积累需要高度灵活的架构&#xff08;React仅专注视图层&#xff0c;可自由搭配…

Python爬虫实战:研究源码还原技术,实现逆向解密

1. 引言 在网络爬虫技术实际应用中,目标网站常采用各种加密手段保护数据传输和业务逻辑。传统逆向解密方法依赖人工分析和调试,效率低下且易出错。随着 Web 应用复杂度提升,特别是 JavaScript 混淆技术广泛应用,传统方法面临更大挑战。 本文提出基于源码还原的逆向解密方法…

什么是alpaca 或 sharegpt 格式的数据集?

环境&#xff1a; LLaMA-Factory 问题描述&#xff1a; alpaca 或 sharegpt 格式的数据集&#xff1f; 解决方案&#xff1a; “Alpaca”和“ShareGPT”格式的数据集&#xff0c;是近年来在开源大语言模型微调和对话数据构建领域比较流行的两种格式。它们主要用于训练和微调…

OpenCV CUDA模块中矩阵操作------矩阵元素求和

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 在OpenCV的CUDA模块中&#xff0c;矩阵元素求和类函数主要用于计算矩阵元素的总和、绝对值之和以及平方和。这些操作对于图像处理中的特征提取、…

给视频加一个动画。

为什么要给视频加一个动画&#xff1f; 很完整的视频也就是从短动画开始的。遮盖住LOG用。 C:\Users\Sam\Desktop\desktop\startup\workpython\ocr Lottie.py import subprocessdef run_ffmpeg(cmd):print("Running:", " ".join(cmd))subprocess.run(cm…

15:00开始面试,15:06就出来了,问的问题有点变态。。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到4月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40%…

使用命令行拉取 Git 仓库

1. 克隆远程仓库&#xff08;首次获取&#xff09; # 克隆仓库到当前目录&#xff08;默认使用 HTTPS 协议&#xff09; git clone https://github.com/用户名/仓库名.git# 克隆仓库到指定目录 git clone https://github.com/用户名/仓库名.git 自定义目录名# 使用 SSH 协议克隆…

如何禁止chrome自动更新

百度了一下 下面这个方法实测有效 目录 1、WINR 输入 services.msc 2、在Services弹窗中找到下面两个service并disable 3、验证是否禁止更新成功&#xff1a; 1、WINR 输入 services.msc 2、在Services弹窗中找到下面两个service并disable GoogleUpdater InternalService…

数据库事务以及JDBC实现事务

一、数据库事务 数据库事务&#xff08;Database Transaction&#xff09;是数据库管理系统中的一个核心概念&#xff0c;它代表一组操作的集合&#xff0c;这些操作要么全部执行成功&#xff0c;要么全部不执行&#xff0c;即操作数据的最小执行单元&#xff0c;保证数据库的…

【vue】【环境配置】项目无法npm run serve,显示node版本过低

解决方案&#xff1a;安装高版本node&#xff0c;并且启用高版本node 步骤&#xff1a; 1、查看当前版本 node -v2、配置nvm下载镜像源 1&#xff09;查看配置文件位置 npm root2&#xff09;找到settings.txt文件 修改镜像源为&#xff1a; node_mirror: https://npmmirro…

WPF之INotifyPropertyChanged实现

文章目录 引言INotifyPropertyChanged接口基础接口定义工作原理 基本实现方式标准实现示例CallerMemberName特性 高级实现技术基类实现通知多个属性变化使用PropertyChanging事件 MVVM框架中的实现MVVM模式简介MVVM框架中的实现Prism框架MVVM Light框架自定义MVVM基类 性能优化…

【MCP教程系列】SpringBoot 搭建基于 Spring AI 的 SSE 模式 MCP 服务

原文地址&#xff1a;https://developer.aliyun.com/article/1662946 在当今快速发展的AI技术背景下&#xff0c;如何高效地集成模型能力成为开发者关注的重点。本文将手把手教你如何基于 Spring AI 搭建支持 SSE&#xff08;Server-Sent Events&#xff09;模式的 MCP 服务 相…

springboot集成langchain4j实现票务助手实战

前言 看此篇的前置知识为langchain4j整合springboot&#xff0c;以及springboot集成langchain4j记忆对话。 Function-Calls介绍 langchain4j 中的 Function Calls&#xff08;函数调用&#xff09;是一种让大语言模型&#xff08;LLM&#xff09;与外部工具&#xff08;如 A…