航空总医院医院网站建设招标网站全国企业公示网查询官网

news/2025/9/26 23:41:59/文章来源:
航空总医院医院网站建设招标网站,全国企业公示网查询官网,南宁论坛,电销做网站的话术目录 1. 数据采集 2. 图像标注 3. 开源已标记数据集 4. 数据集划分 参考#xff1a; 1. 数据采集 数据采集是深度学习和人工智能任务中至关重要的一步#xff0c;它为模型提供了必要的训练样本和测试数据。在实际应用中#xff0c;数据采集的方法多种多样#xff0c;每…目录 1. 数据采集 2. 图像标注 3. 开源已标记数据集 4. 数据集划分 参考 1. 数据采集 数据采集是深度学习和人工智能任务中至关重要的一步它为模型提供了必要的训练样本和测试数据。在实际应用中数据采集的方法多种多样每种方法都有其独特的优势和适用场景。本次将介绍如何标记数据集、 一、什么是数据标注 数据标注即通过分类、画框、标注、注释等对图片、语 音、文本、视频等数据进行处理标记对象的特征以作为机器学习基础 素材的过程。机器学习需要反复学习以训练模型和提高精度同时自动驾驶、语言大模型、AI医疗、等各大应用场景都需要标注数据。 二、数据标注的分类 对于数据标注按照不同的分类标准可以有不同划分。以标注对象作为分类基础可将数据标注划分为图像标注、语音标注、文本标注以及视频标注。 2. 图像标注 图像标注是一个将标签添加到图像上的过程。图像标注类型包括拉框、语义分割、实例分割、 目标检测、图像分类、关键点、线段标注、文字识别转写、点云标注、属性判断等。图像标注在人工智能与各行各业应用相结合的研究过程中扮演着重要的角色通过对路况图片中的汽车和行人进行筛选、分类、标框 可以提高安防摄像头以及无人驾驶系统的识别能力。 通过LabelImg来标注矩形框通过LabelMe来进行多边形框的标定通过PPOCRLabel来完成文本识别标注任务通过roLabelImg来解决旋转目标检测的功能通过DarkLabel来完成视频文件的标注及对象的跟踪功能通过ELAN完成对视频序列中人物动作的识别以及对应字幕的捕捉 简单的使用在线标注数据集的工具Make Sense。 开始标注 打开Make Sense点击Get Start即可开始标注。 进入下一个页面点击Drop images并选中所有数据集。 点击 Object Detection 并添加标签笔者这里以安全帽为例所以创建标签Helmet。然后手动画出安全帽对应的矩形。 标注完成后点击Action-Export Annotation即可导出Yolo格式的标签。 导出的文件如下所示 、 object-class x y width height 其中object-class为类别xywidth和height是指目标的中心点坐标及宽高信息。 3. 开源已标记数据集 使用开源数据集是一种常见且有效的数据采集方法。开源数据集通常已经过标记和验证可大大节省数据采集和标注的时间和资源成本。例如ImageNet数据集包含超过1400万张图像可用于深度学习模型训练。此外还有像Coco、DOTA数据集等笔者在这里为大家整理了常见的深度学习开源数据集地址具体如下以供参考。 coco数据集https://cocodataset.org Pascal Voc数据集https://pjreddie.com/projects/pascal-voc-dataset-mirror/ 猫咪数据集http://m6z.cn/5TAgbw 宠物图像数据集http://m6z.cn/5TAgdC HMDB人类动作识别数据集http://m6z.cn/6gGlzF KITTI道路数据集http://m6z.cn/5xz4OW MPII人体模型数据集http://m6z.cn/69aaIe 天池铝型材表面缺陷数据集http://m6z.cn/61EksR 防护装备-头盔和背心检测http://m6z.cn/61zarT Linkopings交通标志数据集http://m6z.cn/68ldS0 RMFD口罩遮挡人脸数据集http://m6z.cn/61z9Fv 生活垃圾数据集http://m6z.cn/6n5Adu 火焰和烟雾图像数据集http://m6z.cn/6fzn0f MTFL人脸识别数据集http://m6z.cn/6fHmaT 4. 数据集划分 有了数据集之后对齐划分分别分为train,val,test三块。 创建helmet_dataset/images保存图像文件创建helmet_dataset/labels保存标记文件。 分割脚本如下 import os import shutil import zipfile from sklearn.model_selection import train_test_split# 定义目录路径 dataset_directory rhelmet_dataset images_directory os.path.join(dataset_directory, images) labels_directory os.path.join(dataset_directory, labels)# 定义备份 zip 文件路径 backup_zip_path os.path.join(dataset_directory, helmet_dataset.zip)# 将整个数据集目录压缩备份 with zipfile.ZipFile(backup_zip_path, w) as backup_zip:for folder in [images_directory, labels_directory]:for root, dirs, files in os.walk(folder):for file in files:file_path os.path.join(root, file)backup_zip.write(file_path, os.path.relpath(file_path, dataset_directory))# 所有图像文件名不带扩展名的列表 image_filenames [os.path.splitext(filename)[0] for filename in os.listdir(images_directory) if filename.endswith(.jpg)]# 定义拆分比例 train_ratio 0.7 validation_ratio 0.2 test_ratio 0.1# 执行拆分 train_filenames, test_filenames train_test_split(image_filenames, test_size1 - train_ratio) validation_filenames, test_filenames train_test_split(test_filenames, test_sizetest_ratio/(test_ratio validation_ratio))# 创建目录并移动文件的函数 def create_and_move_files(file_list, source_folder, destination_folder, file_extension):os.makedirs(destination_folder, exist_okTrue)for filename in file_list:shutil.move(os.path.join(source_folder, filename file_extension),os.path.join(destination_folder, filename file_extension))# 为每个集创建目录并移动文件 sets_directories {train: os.path.join(dataset_directory, train),val: os.path.join(dataset_directory, val),test: os.path.join(dataset_directory, test) }for set_name, file_list in zip([train, val, test], [train_filenames, validation_filenames, test_filenames]):images_set_directory os.path.join(sets_directories[set_name], images)labels_set_directory os.path.join(sets_directories[set_name], labels)create_and_move_files(file_list, images_directory, images_set_directory, .jpg)create_and_move_files(file_list, labels_directory, labels_set_directory, .txt)# 删除空的images和labels文件夹 for folder in [images_directory, labels_directory]:if os.path.exists(folder) and not os.listdir(folder):os.rmdir(folder)# 返回备份文件路径和已创建目录的路径 print(backup_zip_path, sets_directories) 创建好的数据集留待使用下一次学习如何利用数据集训练。 参考 目标检测1预备知识

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/916860.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式专题——19 Zookeeper分布式一致性协议ZAB源码剖析 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

关于MCO使用配置

关于MCO,相关介绍如下图: 针对以上8个时钟信号作为MCO时钟输出的配置如下:1、系统时钟输出此时MCO引脚(PA8)输出时钟频率即系统主频的大小GPIO_InitTypeDef GPIO_InitStructure = {0};RCC_APB2PeriphClockCmd(RC…

网络运维 --- ntp服务器

网络运维 --- ntp服务器在Windows系统中开启NTP服务器功能,主要可以通过以下步骤实现。以下是详细说明:方法一:通过注册表配置(适用于Windows专业版/服务器版)开启NTP服务器功能:按 Win + R 输入 regedit 打开注…

站点和网站的区别南宁网站建设活动

首先,我们需要明确一点,HTTPS证书的价格并不是一成不变的,它受到多种因素的影响。其中最主要的因素包括证书的类型、颁发机构以及所需的验证级别。 从类型上来看,HTTPS证书主要分为单域名证书、多域名证书和通配符证书。单域名证书…

向量那点事儿

目录一、向量坐标表示二、加减法向量加法应用示例向量减法应用示例三、向量内积应用示例四、向量外积应用示例五、小试牛刀代码示例六、小结 一、向量 这次我们继续聊一下向量。 向量可以理解为一个有方向的量。 它既有…

c++输入输出详解

C++ 的输入输出(I/O)主要通过标准库中的流对象实现,核心是对“数据流”的操作。其语法规则围绕“流对象”“操作符”和“数据类型匹配”展开,以下从标准 I/O(控制台) 和文件 I/O 两部分详细说明。 一、标准输入输…

docker/docker compose/k8s

Docker、Docker Compose 和 Kubernetes(K8s)是现代容器化技术的核心组成部分,但它们扮演着不同的角色。 简单来说:Docker:用来创建和运行单个容器的工具。Docker Compose:用来定义和运行多个相互依赖的容器的工具…

中国开发者迎来新选择:Gitee成为研发协作平台转型期的中流砥柱

中国开发者迎来新选择:Gitee成为研发协作平台转型期的中流砥柱 随着腾讯CODING DevOps系列产品宣布逐步停止服务,中国开发者社区正面临一次重要的工具链迁移抉择。在这一行业转折点上,本土化研发协作平台Gitee凭借其…

PySpark - Get the number of rows

PySpark - Get the number of rowsspark is a SparkSession object, what does spark.sql().collect() do? ChatGPT said:Good question 👍 Let’s break it down:spark → a SparkSession object.spark.sql(query)…

如何推销网站建设做网站怎么签订协议

元描述:想要找到下一个 100 倍加密货币投资?请密切关注这篇文章;它揭示了所有可能很快变得非常有价值的 TON 网络宝石。 由 Telegram 提供支持的 TON(开放网络)生态系统正在蓬勃发展!这是一个充满激动人心的…

RK3588-ubuntu server - 详解

RK3588-ubuntu server - 详解pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco"…

一文教你上手 Geometric Glovius 6.0:安装、授权与首个项目演示

Geometric Glovius 6.0.0是一款功能强大的3D可视化分析软件。它支持CATIA、NX、Creo等多种主流CAD文件格式,能精确测量距离、面积、体积等数据,还可进行动态截面切割、模型差异对比等操作。用户可通过缩放、旋转等方…

32单片机+free rtos移植CJSON库函数主要流程

1.cJSON库的官方地址 源码地址: https://github.com/DaveGamble/cJSON 2.提取cJSON.c cJSON.h 3.在项目中添加cJSON的路径并编译一遍 4.在main函数初始化时添加下面代码,重定向内存的申请,内存申请定向到rtos的内存池…

Gitee如何重塑中国开发者生态:本土化创新与数字化转型的双重奏

Gitee如何重塑中国开发者生态:本土化创新与数字化转型的双重奏 在数字经济蓬勃发展的今天,代码托管平台已经从单纯的工具演变为开发者生态系统的核心枢纽。作为国内领先的一站式代码托管与协作平台,Gitee凭借对中国…

从MESA模型到锁升级:synchronized性能逆袭的底层逻辑

从MESA模型到锁升级:synchronized性能逆袭的底层逻辑管程(Monitor)是一种用于管理共享资源访问的程序结构,能确保同一时刻只有一个线程访问共享资源,解决并发编程中的互斥和同步问题。MESA模型是管程的经典实现,…

网站建设项目进展情况汇报浙江省建设银行纪检官方网站

机器人模型获取 接上期:机器人控制系列教程之控制理论概述,文中详细讲解了如何通过Solidworks软件导出URDF格式的文件。文末提到了若需要将其导入到Simulink中可在命令行中输入smimport(urdf/S_Robot_urdf.urdf),MATLAB将自动打开Simulink以…

输入输出接口

IO接口的作用 又被称为IO控制器,设备控制器,负责协调主机和外部设备之间的数据传输 1.数据缓冲:通过数据缓冲寄存器(DBR)达到主机和外设的工作速度匹配 2.错误或状态检测:通过状态寄存器反馈设备的各种错误,状态…

Go语言中的信号捕获与优雅退出:SIGINT、SIGTERM和SIGKILL详解 - 若

在开发长期运行的服务时,如何让程序优雅退出是一个重要课题。今天我们来深入探讨Go语言中如何处理常见的进程信号,实现平滑关闭。 理解三个关键信号 1. SIGINT(信号2)- 礼貌的中断请求全称:Signal Interrupt触发方…

(二)3.1.9 生产“稳”担当:Apache DolphinScheduler Worker 服务源码全方位解析

本文是 Apache DolphinScheduler 3.1.9 版本源码解读的第二篇:Worker Server 启动流程源码解读以及相关流程设计。结尾处附有相关流程图,供大家参考。作者 | 李杰 移动云,Apache DolphinScheduler贡献者在现代数据驱…

实用指南:虚拟机搭建 DHCP 服务器 + 配置 DHCP 中继:完整实操指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …