cv图像基础处理(包括数据增强，添加掩码，添加镜像，添加噪音，改变颜色，改变图像格式，改变图像光亮，改变图像名字，改变图像大小)_即对原始图像进行翻转、调整亮度、添加高斯噪声和水平镜像等预处理操作资源-CSDN文库

共13个文件

py：13个

需积分: 5 153 浏览量 2023-07-04 20:29:14 上传评论收藏 10KB ZIP 举报

在计算机视觉（CV）领域，图像处理是至关重要的一步，为后续的模型训练和分析提供合适的输入。本压缩包包含了一系列Python脚本，用于实现多种常见的图像基础处理操作。以下是对这些操作的详细解释： 1. **数据增强**：`add_data.py` 可能包含了对图像进行随机变换的技术，如旋转、缩放、平移和翻转，以增加数据集的多样性，减少过拟合，提高模型泛化能力。 2. **添加掩码**：`add_mask.py` 可能用于在图像上添加二值或彩色掩码，这在分割任务中非常常见，比如语义分割或实例分割，掩码可以帮助我们标识出感兴趣的目标区域。 3. **添加镜像**：`add_mirror.py` 实现图像的水平或垂直翻转，这是数据增强的一种方式，帮助模型学习到图像的左右或上下对称性。 4. **添加噪音**：`add_noise.py` 可能包含了向图像添加各种类型的噪声，如高斯噪声、椒盐噪声等，以模拟真实世界中的图像质量问题，提升模型的鲁棒性。 5. **改变颜色**：`change_color.py` 和 `change_color_two.py` 可能用于转换图像的颜色空间，例如从RGB到灰度、HSV或者YUV，或者调整饱和度、亮度和对比度。 6. **改变图像格式**：`change_jpg.py` 可能实现了将图像从一种格式（如JPEG）转换为另一种格式（如PNG、BMP），这在处理不同来源的图像时非常有用。 7. **改变图像光亮**：`change_light.py` 用于调整图像的亮度，可能通过改变像素值来实现，这对于增强图像的可读性和优化模型性能至关重要。 8. **改变图像名字**：`change_name.py` 通常用于批量重命名图像文件，方便管理和跟踪大量的图像数据。 9. **改变图像大小**：调整图像的尺寸 (`resize`) 是常见的预处理步骤，`change_size.py` 可能包含了这一功能，以适应模型输入的要求，同时保持图像的比例或强制固定尺寸。 10. **灰度图**：`photo_reverse.py` 可能包含了将彩色图像转换为灰度图像的代码，灰度图简化了图像，减少了计算量，但保留了图像的基本结构信息。 11. **图像翻转**：与添加镜像类似，`photo_reverse.py` 可能也实现了图像的水平或垂直翻转，提供了额外的数据变化。 12. **图像旋转**：通过旋转图像，可以模拟不同的拍摄角度，增强模型对不同视图的识别能力。这些脚本为CV初学者提供了很好的实践示例，同时也是构建和优化图像处理流水线的基础。理解并应用这些技术，有助于提升计算机视觉模型的性能。在实际项目中，可以根据需求选择合适的处理方法，组合使用以达到最佳效果。

资源推荐

资源详情

资源评论

收起资源包目录

cv_change.zip （13个子文件）

add_mask.py 967B

change_name.py 1KB

change_color_two.py 1KB

photo_huiduhua.py 650B

add_mirror.py 654B

change_jpg.py 799B

change_color.py 944B

photo_reverse.py 978B

add_noise.py 879B

photo_rotate.py 624B

change_light.py 682B

change_size.py 458B

add_data.py 8KB

import time import random import cv2 import os import numpy as np from skimage.util import random_noise import base64 import json import re from copy import deepcopy import argparse class DataAugmentForObjectDetection(): #代码中包含五中数据增强的手段(噪声，光线，改变像素点，平移，镜像，打开后的数据增强为True，取消为False) def __init__(self, change_light_rate=0.5, add_noise_rate=0.5, random_point=0.5, flip_rate=0.5, shift_rate=0.5, rand_point_percent=0.03, is_addNoise=True, is_changeLight=True, is_random_point=True, is_shift_pic_bboxes=True, is_filp_pic_bboxes=True): self.change_light_rate = change_light_rate self.add_noise_rate = add_noise_rate self.random_point = random_point self.flip_rate = flip_rate self.shift_rate = shift_rate self.rand_point_percent = rand_point_percent # 是否使用某种增强方式 self.is_addNoise = is_addNoise self.is_changeLight = is_changeLight self.is_random_point = is_random_point self.is_filp_pic_bboxes = is_filp_pic_bboxes self.is_shift_pic_bboxes = is_shift_pic_bboxes # 加噪声(随机噪声) def _addNoise(self, img): return random_noise(img, seed=int(time.time())) * 255 # 调整亮度 def _changeLight(self, img): alpha = random.uniform(0.35, 1) blank = np.zeros(img.shape, img.dtype) return cv2.addWeighted(img, alpha, blank, 1 - alpha, 0) # 随机的改变点的值 def _addRandPoint(self, img): percent = self.rand_point_percent num = int(percent * img.shape[0] * img.shape[1]) for i in range(num): rand_x = random.randint(0, img.shape[0] - 1) rand_y = random.randint(0, img.shape[1] - 1) if random.randint(0, 1) == 0: img[rand_x, rand_y] = 0 else: img[rand_x, rand_y] = 255 return img # 平移图像(注：需要到labelme工具上调整图像，部分平移的标注框可能会超出图像边界，对训练造成影响) def _shift_pic_bboxes(self, img, json_info): h, w, _ = img.shape x_min = w x_max = 0 y_min = h y_max = 0 shapes = json_info['shapes'] for shape in shapes: points = np.array(shape['points']) x_min = min(x_min, points[:, 0].min()) y_min = min(y_min, points[:, 1].min()) x_max = max(x_max, points[:, 0].max()) y_max = max(y_max, points[:, 0].max()) d_to_left = x_min d_to_right = w - x_max d_to_top = y_min d_to_bottom = h - y_max x = random.uniform(-(d_to_left - 1) / 3, (d_to_right - 1) / 3) y = random.uniform(-(d_to_top - 1) / 3, (d_to_bottom - 1) / 3) M = np.float32([[1, 0, x], [0, 1, y]]) shift_img = cv2.warpAffine(img, M, (img.shape[1], img.shape[0])) for shape in shapes: for p in shape['points']: p[0] += x p[1] += y return shift_img, json_info # 图像镜像翻转 def _filp_pic_bboxes(self, img, json_info): h, w, _ = img.shape sed = random.random() if 0 < sed < 0.33: flip_img = cv2.flip(img, 0) # _flip_x inver = 0 elif 0.33 < sed < 0.66: flip_img = cv2.flip(img, 1) # _flip_y inver = 1 else: flip_img = cv2.flip(img, -1) # flip_x_y inver = -1 shapes = json_info['shapes'] for shape in shapes: for p in shape['points']: if inver == 0: p[1] = h - p[1] elif inver == 1: p[0] = w - p[0] elif inver == -1: p[0] = w - p[0] p[1] = h - p[1] return flip_img, json_info def dataAugment(self, img, dic_info): change_num = 0 while change_num < 1: if self.is_changeLight: if random.random() > self.change_light_rate: change_num += 1 img = self._changeLight(img) if self.is_addNoise: if random.random() < self.add_noise_rate: change_num += 1 img = self._addNoise(img) if self.is_random_point: if random.random() < self.random_point: change_num += 1 img = self._addRandPoint(img) if self.is_shift_pic_bboxes: if random.random() < self.shift_rate: change_num += 1 img, dic_info = self._shift_pic_bboxes(img, dic_info) if self.is_filp_pic_bboxes or 1: if random.random() < self.flip_rate: change_num += 1 img, bboxes = self._filp_pic_bboxes(img, dic_info) return img, dic_info class ToolHelper(): # 从json文件中提取原始标定的信息 def parse_json(self, path): with open(path)as f: json_data = json.load(f) return json_data # 对图片进行字符编码 def img2str(self, img_name): with open(img_name, "rb")as f: base64_data = str(base64.b64encode(f.read())) match_pattern = re.compile(r'b\'(.*)\'') base64_data = match_pattern.match(base64_data).group(1) return base64_data # 保存图片结果 def save_img(self, save_path, img): cv2.imwrite(save_path, img) # 保持json结果 def save_json(self, file_name, save_folder, dic_info): with open(os.path.join(save_folder, file_name), 'w') as f: json.dump(dic_info, f, indent=2) if __name__ == '__main__': need_aug_num = 5 #每张图片需要增强的次数 toolhelper = ToolHelper() is_endwidth_dot = True #文件是否以.jpg或者png结尾 dataAug = DataAugmentForObjectDetection() parser = argparse.ArgumentParser() parser.add_argument('--source_img_json_path', type=str, default=r'C:\Users\12302\Desktop\first')#需要更改的json地址 parser.add_argument('--save_img_json_path', type=str, default=r'C:\Users\12302\Desktop\addData')#改变后的json保存地址 args = parser.parse_args() source_img_json_path = args.source_img_json_path # 图片和json文件原始位置 save_img_json_path = args.save_img_json_path # 图片增强结果保存文件 # 如果保存文件夹不存在就创建 if not os.path.exists(save_img_json_path): os.mkdir(save_img_json_path) for parent, _, files in os.walk(source_img_json_path): files.sort() # 排序一下 for file in files: if file.endswith('jpg') or file.endswith('png'): cnt = 0 pic_path = os.path.join(parent, file) json_path = os.path.join(parent, file[:-4] + '.json') json_dic = toolhelper.parse_json(json_path) # 如果图片是有后缀的 if is_endwidth_dot: # 找到文件的最后名字 dot_index = file.rfind('.') _file_prefix = file[:dot_index] # 文件名的前缀 _file_suffix = file[dot_index:] # 文件名的后缀 img = cv2.imread(pic_path) while cnt < need_aug_num: # 继续增强 auged_img, json_info = dataAug.dataAugment(deepcopy(img), deepcopy(json_dic)) img_name = '{}_{}{}'.format(_file_prefix, cnt + 1, _file_suffix) # 图片保存的信息 img_save_path = os.path.join(save_img_json_path, img_name)

评论收藏

内容反馈