基于Python的图像数据增强DataAugmentation解析_python图像数据增强,python图像数据增强资源-CSDN文库

160 浏览量 2020-09-18 20:30:21 上传评论 2 收藏 803KB PDF 举报

在深度学习领域，尤其是计算机视觉任务中，数据增强（Data Augmentation）是一种重要的技术，用于扩大训练集的多样性和规模，以提高模型的泛化能力。本篇文章将深入探讨如何使用Python实现图像数据增强，主要关注翻转、旋转和缩放等基本操作。 1. **数据增强的重要性** 深度神经网络通常需要大量标注数据才能训练出高质量的模型。然而，收集大量带有标签的图像数据既耗时又昂贵。数据增强提供了一种经济有效的方法，通过对现有图像进行各种变换，模拟真实世界中的变化，从而增加训练数据的多样性。 2. **翻转（Flip）** 翻转是最简单且常用的数据增强手段，包括水平翻转和垂直翻转。这种方法可以确保模型对镜像对称的图像也能做出正确的预测。例如，在人体姿态估计和跟踪中，水平翻转图像可以保证模型对左右两侧姿态的识别能力。 3. **旋转（Rotate）** 旋转是另一种常见的增强方式，它允许模型适应不同角度下的图像。在实际应用中，物体可能出现在各种角度，因此旋转可以增加模型对角度变化的鲁棒性。 4. **缩放（Scale）** 缩放操作涉及改变图像的尺寸，它可以扩展模型对不同大小物体的理解。在上面的代码中，`crop`函数首先对图像进行裁剪，然后使用`scale`函数调整图像的大小，以适应预定义的输入尺寸。这有助于模型适应不同距离或分辨率下的对象。 5. **裁剪与缩放的实现** `crop`函数接收图像、边界框（bbox）、关键点坐标以及目标长度作为参数。它首先根据边界框裁剪图像，然后缩放到指定长度，并填充到固定大小的矩阵中。`scale`函数则根据缩放因子调整图像尺寸，同时更新边界框和关键点坐标，以保持相对位置。 6. **颜色抖动和噪声添加** 虽然在给出的示例中没有涉及，但颜色抖动（Color jittering）和噪声添加也是常用的数据增强技术。颜色抖动通过随机改变图像的亮度、对比度、饱和度等属性，使模型对不同光照条件下的图像更具适应性。噪声添加则模拟现实世界中可能出现的图像噪声，提高模型的抗干扰能力。 7. **使用库进行数据增强** Python中有多个库支持图像数据增强，如`OpenCV`、`PIL`、`TensorFlow`的`tf.data` API和`Keras`的`ImageDataGenerator`。这些库提供了丰富的预定义变换，使得实现数据增强变得更加便捷。 8. **总结** 数据增强是深度学习中不可或缺的一部分，它能有效提升模型的性能，特别是当可用训练数据有限时。通过理解并应用各种数据增强技术，如翻转、旋转和缩放，我们可以构建出更加鲁棒的计算机视觉模型，更好地应对实际环境中的挑战。在实践中，可以根据具体任务的需求选择和组合不同的增强策略。

资源详情

资源评论

基于基于Python的图像数据增强的图像数据增强Data Augmentation解析解析

主要介绍了基于Python的图像数据增强Data Augmentation解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1.1 简介简介

深层神经网络一般都需要大量的训练数据才能获得比较理想的结果。在数据量有限的情况下，可以通过数据增强（Data Augmentation）来增加训练样本的多样性，提高模型鲁棒性，避免过拟合。

在计算机视觉中，典型的数据增强方法有翻转（Flip），旋转（Rotat ），缩放（Scale），随机裁剪或补零（Random Crop or Pad），色彩抖动（Color jittering），加噪声（Noise）

笔者在跟进视频及图像中的人体姿态检测和关键点追踪（Human Pose Estimatiion and Tracking in videos）的项目。因此本文的数据增强仅使用——翻转（Flip），旋转（Rotate ），缩放以及缩放

（Scale）

2.1 裁剪（裁剪（Crop））

image.shape--([3, width, height])一个视频序列中的一帧图片,裁剪前大小不统一

bbox.shape--([4,])人体检测框，用于裁剪

x.shape--([1,13]) 人体13个关键点的所有x坐标值

y.shape--([1,13])人体13个关键点的所有y坐标值

def crop(image, bbox, x, y, length):

x, y, bbox = x.astype(np.int), y.astype(np.int), bbox.astype(np.int)

x_min, y_min, x_max, y_max = bbox

w, h = x_max - x_min, y_max - y_min

# Crop image to bbox

image = image[y_min:y_min + h, x_min:x_min + w, :]

# Crop joints and bbox

x -= x_min

y -= y_min

bbox = np.array([0, 0, x_max - x_min, y_max - y_min])

# Scale to desired size

side_length = max(w, h)

f_xy = float(length) / float(side_length)

image, bbox, x, y = Transformer.scale(image, bbox, x, y, f_xy)

# Pad

new_w, new_h = image.shape[1], image.shape[0]

cropped = np.zeros((length, length, image.shape[2]))

dx = length - new_w

dy = length - new_h

x_min, y_min = int(dx / 2.), int(dy / 2.)

x_max, y_max = x_min + new_w, y_min + new_h

cropped[y_min:y_max, x_min:x_max, :] = image

x += x_min

y += y_min

x = np.clip(x, x_min, x_max)

y = np.clip(y, y_min, y_max)

bbox += np.array([x_min, y_min, x_min, y_min])

return cropped, bbox, x.astype(np.int), y.astype(np.int)

2.2 缩放（缩放（Scale））

image.shape--([3, 256, 256])一个视频序列中的一帧图片，裁剪后输入网络为256*256

bbox.shape--([4,])人体检测框，用于裁剪

x.shape--([1,13]) 人体13个关键点的所有x坐标值

y.shape--([1,13])人体13个关键点的所有y坐标值

f_xy--缩放倍数

def scale(image, bbox, x, y, f_xy):

(h, w, _) = image.shape

h, w = int(h * f_xy), int(w * f_xy)

image = resize(image, (h, w), preserve_range=True, anti_aliasing=True, mode='constant').astype(np.uint8)

x = x * f_xy

y = y * f_xy

bbox = bbox * f_xy

x = np.clip(x, 0, w)

y = np.clip(y, 0, h)

return image, bbox, x, y

2.3 翻转（翻转（fillip））

这里是将图片围绕对称轴进行左右翻转（因为人体是左右对称的，在关键点检测中有助于防止模型过拟合）

def flip(image, bbox, x, y):

image = np.fliplr(image).copy()

w = image.shape[1]

x_min, y_min, x_max, y_max = bbox

bbox = np.array([w - x_max, y_min, w - x_min, y_max])

x = w - x

x, y = Transformer.swap_joints(x, y)

return image, bbox, x, y

翻转前：

翻转后：

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论收藏

内容反馈

基于Python的图像数据增强Data Augmentation解析

评论0

最新资源

基于Python的图像数据增强Data Augmentation解析

评论0

最新资源

相关推荐

Python图像数据增强，包括图像绕中心点随机角度旋转，图像PCA，分测试集和训练集的方法，IOU检测，改xml文件，算法人适用

python图像数据增强

python实现图像数据增强

python实现图像增强

数据增强方法

数据增强代码data_augmentation.py

图像批量数据增强（平移、旋转，翻转，对比度增强等）

图像增强python算法

VOC增强数据集数据转换代码

【计算机视觉】针对图像的DataAugmentation（数据扩充）介绍，常用方法和Ten。。。 计算机视觉.pdf

TensorFlow.keras数据增强Data Augmentation

Data Augmentation Approaches in Natural Language Processing

Data Augmentation for ML-driven Data Preparation and Integration

Survey Image Mixing and Deleting for Data Augmentation.pdf

图像数据增强

python图像数据增强代码，深度学习用，分割，合并，数据增强，批量化修改文件名，归一化大小

基于图像的数据增强方法发展现状综述

Python-用于场景文本图像数据增强的工具

Python-用于对象检测的数据增强

DADA:DADA的官方代码

Python-无监督数据增强UDA的TensorFlow代码

**python代码实现目标检测数据增强**

Survey Image Mixing and Deleting for Data Augmentation.zip

用于基于事件的学习的EventDrop数据扩充_EventDrop data augmentation for event-ba

Data Augmentation.ipynb

Python-Audiomentations用于音频数据增强的Python库

nlp-data-augmentation：用于NLP的数据增强。 NLP数据增强

Synthetic Data Augmentation using GAN for Improved Liver Lesion Classification

keras-data-augmentation.zip

【计算机视觉】针对图像的DataAugmentation（数据扩充）介绍，常用方法和Ten。。。计算机视觉.pdf

python代码实现目标检测数据增强