文章目录
- 前言
- 一、步骤指南
- 二、代码实现
- 1.类别名称到ID的映射
- 2.边界框转换函数
- 3.JSON解码函数
- 4.主程序
 
前言
将JSON标注文件转换为YOLO格式通常涉及从JSON文件中提取图像尺寸、对象类别和边界框坐标,并将这些信息格式化为YOLO格式所需的格式。YOLO格式通常要求每行包含一个对象的类别ID、归一化后的中心坐标(x, y)以及归一化后的宽度和高度(w, h)。
一、步骤指南
- 读取JSON文件:使用Python的json库读取JSON文件。
- 提取图像尺寸:从JSON数据中获取图像的宽度和高度。
- 遍历标注:遍历JSON数据中的标注列表。
- 提取边界框和类别:对于每个标注,提取边界框的坐标(通常是左上角和右下角的x, y坐标)和对象类别。
- 转换边界框:将边界框坐标转换为YOLO格式所需的归一化中心坐标和宽度/高度。
- 写入YOLO格式文件:将类别ID和归一化后的边界框坐标写入文本文件,每行一个对象。
二、代码实现
1.类别名称到ID的映射
import json  
import os  # 类别名称到ID的映射  
name2id = {'dog': 0, 'cat': 1}  # 根据您的数据集添加更多类别  
这是一个字典,将类别名称(如dog和cat)映射到对应的ID(整数)。这是因为在YOLO格式中,目标类别是通过整数ID来表示的。
2.边界框转换函数
def convert(size, box):  dw = 1. / size[0]  dh = 1. / size[1]  x = (box[0] + box[2]) / 2.0  y = (box[1] + box[3]) / 2.0  w = box[2] - box[0]  h = box[3] - box[1]  x = x * dw  y = y * dh  w = w * dw  h = h * dh  return x, y, w, h
- 定义一个函数,这个函数接受两个参数:size(图像的宽度和高度)和box(边界框的坐标,格式为[x1, y1, x2, y2])。
- 将边界框的坐标转换为相对于图像尺寸的比例,并计算边界框的中心点(x, y)和宽度(w)及高度(h)。且这些值被归一化到0到1的范围内,这是YOLO格式的要求。
3.JSON解码函数
def decode_json(json_folder_path, json_filename):  # 构造YOLO格式文件的路径  txt_filename = os.path.join('F:\\path\\to\\your\\labels', json_filename.replace('.json', '.txt'))  with open(txt_filename, 'w') as txt_file:  # 读取JSON文件  json_path = os.path.join(json_folder_path, json_filename)  with open(json_path, 'r', encoding='utf-8') as json_file:  # 根据您的JSON文件编码选择正确的编码  data = json.load(json_file)  # 提取图像尺寸(这里假设JSON结构有一个'width'和'height'字段)  img_width = data.get('width', 0)  img_height = data.get('height', 0)  # 遍历标注(这里假设JSON结构有一个'annotations'或'objects'字段包含标注列表)  for annotation in data.get('annotations', data.get('objects', [])):  label_name = annotation['label']  # 提取类别名称  if label_name in name2id:  # 检查类别名称是否在映射中  # 提取边界框坐标(这里假设边界框是一个包含四个元素的列表或数组:[x1, y1, x2, y2])  bbox = annotation['bbox'] if 'bbox' in annotation else annotation['points'][0:2] + annotation['points'][2:4]  # 根据您的JSON结构选择正确的字段  x1, y1, x2, y2 = bbox  # 转换边界框并写入文件  x, y, w, h = convert((img_width, img_height), (x1, y1, x2, y2))  txt_file.write(f"{name2id[label_name]} {x} {y} {w} {h}\n")  -  定义函数,这个函数接受JSON文件夹的路径和JSON文件的名称作为输入。 
-  首先构造YOLO格式文件的输出路径。然后,它读取并解析JSON文件,提取图像的宽度和高度,以及标注信息。对于每个标注,它检查类别名称是否在name2id映射中。如果是,它提取边界框坐标,调用convert函数进行转换,并将结果写入YOLO格式的文本文件中。 
4.主程序
if __name__ == "__main__":  json_folder_path = 'F:\\path\\to\\your\\jsons'  # 替换为您的JSON文件夹路径  json_filenames = os.listdir(json_folder_path)  for json_filename in json_filenames:  if json_filename.endswith('.json'):  # 只处理JSON文件  decode_json(json_folder_path, json_filename)
- 这是脚本的入口点。当脚本被直接运行时,这部分代码会被执行。
- 它设置JSON文件夹的路径,列出该文件夹中的所有文件,并对每个以.json结尾的文件调用decode_json函数。