VOC格式数据集扩充（含XML文件）_voc格式数据集进行数据增强资源-CSDN文库

共1个文件

py：1个

需积分: 5 192 浏览量 2022-06-16 13:55:41 上传评论 3 收藏 2KB ZIP 举报

VOC（PASCAL Visual Object Classes）格式是一种广泛用于计算机视觉领域，特别是图像识别和对象检测的数据集标准。它包含了图像、对应的标注信息，以及一个详细的类别定义列表。VOC数据集通常由图像文件（.jpg）和XML文件（.xml）组成，其中XML文件描述了图像中的每个对象边界框及其类别。在训练神经网络时，数据集的大小和多样性至关重要，因为这直接影响到模型的泛化能力。"VOC格式数据集扩充"意味着将现有的VOC数据集通过某些方法进行扩大，比如图像增强、合成或者复制，以便增加训练样本的数量。这种方法可以帮助神经网络更好地学习，尤其是在小数据集上，可以有效防止过拟合。 kuochong.py 可能是一个Python脚本，用于实现这个数据集扩充的过程。通常，这样的脚本会包含以下功能： 1. **读取原始数据**：脚本需要能够读取VOC数据集中的图像和对应的XML标注文件。 2. **图像处理**：图像增强技术如旋转、翻转、裁剪、缩放和色彩变换可以被用来生成新的图像实例。这些操作可以在保持原有对象信息的同时，增加数据的多样性。 3. **XML处理**：对于每张处理过的图像，相应的XML文件也需要更新以反映新的边界框坐标和可能的对象状态变化。 4. **随机性**：为了确保数据集的扩充是随机且无偏的，脚本可能包含随机种子设置，使得每次运行都能得到不同的扩充结果。 5. **保存扩充数据**：脚本会将扩充后的图像和XML文件保存为新的VOC格式数据集，供后续的模型训练使用。在训练过程中，使用扩充数据集有以下几个优点： - **增加多样性**：扩充数据集可以让模型看到更多的图像变体，提高其对现实世界变化的适应性。 - **防止过拟合**：更多的训练样本有助于模型学习更一般的特征，减少在特定样例上过拟合的可能性。 - **提升性能**：通过增大训练集，模型通常能得到更好的训练效果，进而提高测试阶段的性能。在实际应用中，开发者可能会结合其他数据集或自定义数据进行进一步的融合和扩充，以创建更适合特定任务的大型数据集。VOC格式数据集的扩充是提升深度学习模型性能的重要手段之一，尤其在对象检测和图像分类等任务中。

资源详情

资源评论

资源推荐

收起资源包目录

VOC数据集扩充代码.zip （1个子文件）

kuochong.py 7KB

import xml.etree.ElementTree as ET import os import imgaug as ia import numpy as np import shutil from tqdm import tqdm from PIL import Image from imgaug import augmenters as iaa ia.seed(1) def read_xml_annotation(root, image_id): in_file = open(os.path.join(root, image_id)) tree = ET.parse(in_file) root = tree.getroot() bndboxlist = [] for object in root.findall('object'): # 找到root节点下的所有country节点 bndbox = object.find('bndbox') # 子节点下节点rank的值 xmin = int(bndbox.find('xmin').text) xmax = int(bndbox.find('xmax').text) ymin = int(bndbox.find('ymin').text) ymax = int(bndbox.find('ymax').text) # print(xmin,ymin,xmax,ymax) bndboxlist.append([xmin, ymin, xmax, ymax]) # print(bndboxlist) bndbox = root.find('object').find('bndbox') return bndboxlist # (506.0000, 330.0000, 528.0000, 348.0000) -> (520.4747, 381.5080, 540.5596, 398.6603) def change_xml_annotation(root, image_id, new_target): new_xmin = new_target[0] new_ymin = new_target[1] new_xmax = new_target[2] new_ymax = new_target[3] in_file = open(os.path.join(root, str(image_id) + '.xml')) # 这里root分别由两个意思 tree = ET.parse(in_file) xmlroot = tree.getroot() object = xmlroot.find('object') bndbox = object.find('bndbox') xmin = bndbox.find('xmin') xmin.text = str(new_xmin) ymin = bndbox.find('ymin') ymin.text = str(new_ymin) xmax = bndbox.find('xmax') xmax.text = str(new_xmax) ymax = bndbox.find('ymax') ymax.text = str(new_ymax) tree.write(os.path.join(root, str("%06d" % (str(id) + '.xml')))) def change_xml_list_annotation(root, image_id, new_target, saveroot, id): in_file = open(os.path.join(root, str(image_id) + '.xml')) # 这里root分别由两个意思 tree = ET.parse(in_file) # 修改增强后的xml文件中的filename elem = tree.find('filename') elem.text = (str(id) + '.jpg') xmlroot = tree.getroot() # 修改增强后的xml文件中的path elem = tree.find('path') if elem != None: elem.text = (saveroot + str(id) + '.jpg') index = 0 for object in xmlroot.findall('object'): # 找到root节点下的所有country节点 bndbox = object.find('bndbox') # 子节点下节点rank的值 # xmin = int(bndbox.find('xmin').text) # xmax = int(bndbox.find('xmax').text) # ymin = int(bndbox.find('ymin').text) # ymax = int(bndbox.find('ymax').text) new_xmin = new_target[index][0] new_ymin = new_target[index][1] new_xmax = new_target[index][2] new_ymax = new_target[index][3] xmin = bndbox.find('xmin') xmin.text = str(new_xmin) ymin = bndbox.find('ymin') ymin.text = str(new_ymin) xmax = bndbox.find('xmax') xmax.text = str(new_xmax) ymax = bndbox.find('ymax') ymax.text = str(new_ymax) index = index + 1 tree.write(os.path.join(saveroot, str(id + '.xml'))) def mkdir(path): # 去除首位空格 path = path.strip() # 去除尾部 \ 符号 path = path.rstrip("\\") # 判断路径是否存在 # 存在 True # 不存在 False isExists = os.path.exists(path) # 判断结果 if not isExists: # 如果不存在则创建目录 # 创建目录操作函数 os.makedirs(path) print(path + ' 创建成功') return True else: # 如果目录存在则不创建，并提示目录已存在 print(path + ' 目录已存在') return False if __name__ == "__main__": IMG_DIR = "VOCdevkit/VOC2007/JPEGImages/" XML_DIR = "VOCdevkit/VOC2007/Annotations/" AUG_XML_DIR = "./AUG/Annotations/" # 存储增强后的XML文件夹路径 try: shutil.rmtree(AUG_XML_DIR) except FileNotFoundError as e: a = 1 mkdir(AUG_XML_DIR) AUG_IMG_DIR = "./AUG/JPEGImages/" # 存储增强后的影像文件夹路径 try: shutil.rmtree(AUG_IMG_DIR) except FileNotFoundError as e: a = 1 mkdir(AUG_IMG_DIR) AUGLOOP = 5 # 每张影像增强的数量 boxes_img_aug_list = [] new_bndbox = [] new_bndbox_list = [] # 影像增强 seq = iaa.Sequential([ iaa.Invert(0.5), iaa.Fliplr(0.5), # 镜像 iaa.Multiply((1.2, 1.5)), # change brightness, doesn't affect BBs iaa.GaussianBlur(sigma=(0, 3.0)), # iaa.GaussianBlur(0.5), iaa.Affine( translate_px={"x": 15, "y": 15}, scale=(0.8, 0.95), ) # translate by 40/60px on x/y axis, and scale to 50-70%, affects BBs ]) for name in tqdm(os.listdir(XML_DIR), desc='Processing'): bndbox = read_xml_annotation(XML_DIR, name) # 保存原xml文件 shutil.copy(os.path.join(XML_DIR, name), AUG_XML_DIR) # 保存原图 og_img = Image.open(IMG_DIR + '/' + name[:-4] + '.jpg') og_img.convert('RGB').save(AUG_IMG_DIR + name[:-4] + '.jpg', 'JPEG') og_xml = open(os.path.join(XML_DIR, name)) tree = ET.parse(og_xml) # 修改增强后的xml文件中的filename elem = tree.find('filename') elem.text = (name[:-4] + '.jpg') tree.write(os.path.join(AUG_XML_DIR, name)) for epoch in range(AUGLOOP): seq_det = seq.to_deterministic() # 保持坐标和图像同步改变，而不是随机 # 读取图片 img = Image.open(os.path.join(IMG_DIR, name[:-4] + '.jpg')) # sp = img.size img = np.asarray(img) # bndbox 坐标增强 for i in range(len(bndbox)): bbs = ia.BoundingBoxesOnImage([ ia.BoundingBox(x1=bndbox[i][0], y1=bndbox[i][1], x2=bndbox[i][2], y2=bndbox[i][3]), ], shape=img.shape) bbs_aug = seq_det.augment_bounding_boxes([bbs])[0] boxes_img_aug_list.append(bbs_aug) # new_bndbox_list:[[x1,y1,x2,y2],...[],[]] n_x1 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x1))) n_y1 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y1))) n_x2 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x2))) n_y2 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y2))) if n_x1 == 1 and n_x1 == n_x2: n_x2 += 1 if n_y1 == 1 and n_y2 == n_y1: n_y2 += 1 if n_x1 >= n_x2 or n_y1 >= n_y2: print('error', name) new_bndbox_list.append([n_x1, n_y1, n_x2, n_y2]) # 存储变化后的图片 image_aug = seq_det.augment_images([img])[0] path = os.path.join(AUG_IMG_DIR, str(str(name[:-4]) + '_' + str(epoch)) + '.jpg') image_auged = bbs.draw_on_image(image_aug, size=0) Image.fromarray(image_auged).convert('RGB').save(path) # 存储变化后的XML change_xml_list_annotation(XML_DIR, name[:-4], new_bndbox_list, AUG_XML_DIR, str(name[:-4]) + '_' + str(epoch)) # print(str(str(name[:-4]) + '_' + str(epoch)) + '.jpg') new_bndbox_list = [] print('Finish!')