首页 > 其他分享> > 【深度学习】基于Keras的Data Augmentation方法

【深度学习】基于Keras的Data Augmentation方法

2022-03-01 19:03:12 作者：互联网

首先为什么我们需要对数据集进行Data Augmentation

对于现有的数据集来说，有些时候往往是不够的。举个例子，汽车识别，如果训练集当中只有汽车的正方位的图片，那么如果我们需要识别的图片是汽车的侧方位，这就导致了识别率的不高
进行了数据加强，那么就能够让机器有足够的训练集去训练，这样一来就可以显著的提高识别率

本文主要参考的博客

那么数据加强都有哪些功能

旋转|反射变换：随机图像一定角度，改变图像内容的朝向
翻转变换：沿着水平或垂直方向翻转图像
缩放变换：按照一定比例放大或者缩小图像
平移变换：在图像平面上对图像以一定的方式进行平移；可以采用随机或人为定义的方式指定平移范围和平移步长, 沿水平或竖直方向进行平移. 改变图像内容的位置;
尺度变换：对图像按照指定的尺度因子, 进行放大或缩小; 或者参照SIFT特征提取思想, 利用指定的尺度因子对图像滤波构造尺度空间. 改变图像内容的大小或模糊程度;
对比度变换：在图像的HSV颜色空间，改变饱和度S和V亮度分量，保持色调H不变. 对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间), 增加光照变化;
噪声扰动：对图像的每个像素RGB进行随机扰动, 常用的噪声模式是椒盐噪声和高斯噪声;
颜色变换：在训练集像素值的RGB颜色空间进行PCA, 得到RGB空间的3个主方向向量,3个特征值, p1, p2, p3, λ1, λ2, λ3. 对每幅图像的每个像素Ixy=[IRxy,IGxy,IBxy]T进行加上如下的变化:
[p1,p2,p3][α1λ1,α2λ2,α3λ3]T

其中:αi是满足均值为0,方差为0.1的随机变量.

实现代码：

# -*- coding: utf-8 -*-
__author__ = 'Administrator'

import numpy as np
import tensorflow

# import packages
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img

datagen = ImageDataGenerator(
    rotation_range=0.2,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

# img = load_img('C:\Users\Administrator\Desktop\dataA\lena.jpg')  # this is a PIL image, please replace to your own file path
img = load_img(
    'D:/picture1/xz.jpg')  # this is a PIL image, please replace to your own file path

x = img_to_array(img)  # this is a Numpy array with shape (3, 150, 150)
x = x.reshape((1,) + x.shape)  # this is a Numpy array with shape (1, 3, 150, 150)

# the .flow() command below generates batches of randomly transformed images
# and saves the results to the `preview/` directory

i = 0
for batch in datagen.flow(x,
                          batch_size=1,
                          save_to_dir='D:/picture',  # 生成后的图像保存路径
                          save_prefix='lena',
                          save_format='jpg'):
    i += 1
    if i > 20:  # 这个20指出要扩增多少个数据
        break  # otherwise the generator would loop indefinitely

实现效果如下：

1.首先我们需要自己去找到一张需要加强数据集的图片
在这里插入图片描述
2.然后就是数据加强之后的图片

3.虽然结果出来了，但是还是有点问题，虽然说数据加强代码实现了旋转，平移，放大缩小，填充像素，但是还是有一些不足的地方
比如下图，图片的周围都是不清晰的像马赛克一样的东西
在这里插入图片描述

每一岁的成长，都仍要奔走在自己的热爱里

标签：img,Keras,0.2,像素,range,Augmentation,图像,array,Data
来源： https://blog.csdn.net/qq_44833724/article/details/123212629