基于CNN算法实现四种花的识别_CNN花朵识别资源-CSDN文库

共3053个文件

jpg：3039个

py：5个

pyc：3个

tensor

opencv

python

图像识别

需积分: 50 46 浏览量 2019-04-03 19:04:31 上传评论 16 收藏 40.6MB RAR 举报

在本项目中，我们主要探讨的是如何利用深度学习中的卷积神经网络（CNN）来实现对四种不同类型花卉的识别。这个任务属于计算机视觉领域中的图像分类问题，它可以帮助我们在现实生活中自动化识别花卉，例如用于植物识别应用或者园艺研究。让我们详细了解一下CNN（卷积神经网络）。CNN是一种专门处理二维数据，如图像的深度学习模型。其核心特点是通过卷积层、池化层以及全连接层等结构，模拟人脑视觉皮层的工作原理，提取图像特征并进行分类。在这个项目中，CNN将学习识别花卉的特征，如花瓣形状、颜色分布、纹理等，从而对不同类型的花卉进行区分。项目实现过程中，Python被用作编程语言，这是因为Python拥有丰富的科学计算库和深度学习框架，如TensorFlow和Keras，使得构建和训练神经网络模型变得相对简单。TensorFlow是一个强大的开源库，用于构建和部署机器学习模型，它支持高效的数值计算，并且与Keras结合使用时，可以提供简洁的接口来构建和训练CNN模型。 OpenCV库在这里可能被用来预处理输入的图像。预处理步骤包括调整图像大小、归一化像素值、灰度转换、色彩空间转换等，这些步骤有助于提高模型的训练效果。此外，OpenCV还可以用于从本地或相机捕获图像，以便进行实时的花卉识别。在训练CNN模型时，通常需要一个标注好的数据集，包含四种花卉的不同样本。每个样本都有对应的类别标签。训练过程包括前向传播、反向传播和权重更新，以最小化损失函数，达到准确预测的目的。模型训练完成后，可以对新的未知花卉图像进行预测，通过比较其特征与训练集中花卉特征的相似度，确定其最可能的类别。项目的代码可能包含了以下部分： 1. 数据加载和预处理：这部分代码会读取数据集，对图像进行预处理，并将其划分为训练集和测试集。 2. 构建CNN模型：这涉及定义网络架构，包括卷积层、池化层、全连接层等，以及损失函数和优化器。 3. 模型训练：使用训练数据对模型进行迭代训练，调整权重以最小化损失。 4. 模型评估：在测试集上评估模型的性能，如准确率、精度、召回率和F1分数等。 5. 图像识别：这部分代码会处理用户提供的本地图像或实时拍摄的图像，将其输入到训练好的模型中，返回预测结果。这个项目展示了深度学习技术在解决实际问题中的应用，特别是CNN在图像识别领域的强大能力。通过不断地优化模型参数和增加训练数据，我们可以进一步提高花卉识别的准确性和泛化能力。

资源推荐

资源详情

资源评论

收起资源包目录

基于CNN算法实现四种花的识别（3053个子文件）

checkpoint 173B

model.ckpt-9999.data-00000-of-00001 32.43MB

events.out.tfevents.1554262217.FLIPPED 1010KB

model.ckpt-9999.index 2KB

sunflower.jpg 20KB

images.jpg 8KB

2510samples3.jpg 3KB

1092samples1.jpg 3KB

2479samples3.jpg 3KB

687samples1.jpg 3KB

1090samples1.jpg 3KB

2765samples3.jpg 3KB

1283samples1.jpg 3KB

2706samples3.jpg 3KB

1089samples1.jpg 3KB

2573samples3.jpg 3KB

1205samples1.jpg 3KB

770samples1.jpg 3KB

2746samples3.jpg 3KB

2932samples3.jpg 3KB

992samples1.jpg 3KB

1172samples1.jpg 3KB

2597samples3.jpg 3KB

1236samples1.jpg 3KB

1014samples1.jpg 3KB

2567samples3.jpg 3KB

2927samples3.jpg 3KB

841samples1.jpg 3KB

667samples1.jpg 3KB

1223samples1.jpg 3KB

1473samples2.jpg 3KB

1878samples2.jpg 3KB

1093samples1.jpg 3KB

1293samples1.jpg 3KB

316samples0.jpg 3KB

2571samples3.jpg 3KB

130samples0.jpg 3KB

665samples1.jpg 3KB

759samples1.jpg 3KB

1212samples1.jpg 3KB

960samples1.jpg 3KB

2483samples3.jpg 3KB

2763samples3.jpg 3KB

2254samples2.jpg 3KB

771samples1.jpg 3KB

668samples1.jpg 3KB

957samples1.jpg 3KB

991samples1.jpg 3KB

807samples1.jpg 3KB

2974samples3.jpg 3KB

1454samples2.jpg 3KB

2484samples3.jpg 3KB

563samples0.jpg 3KB

2913samples3.jpg 3KB

839samples1.jpg 3KB

2560samples3.jpg 3KB

1033samples1.jpg 3KB

158samples0.jpg 3KB

3035samples3.jpg 3KB

2741samples3.jpg 3KB

1197samples1.jpg 3KB

2660samples3.jpg 3KB

848samples1.jpg 3KB

605samples0.jpg 3KB

1187samples1.jpg 3KB

1043samples1.jpg 3KB

1632samples2.jpg 3KB

2972samples3.jpg 3KB

2889samples3.jpg 3KB

1365samples1.jpg 3KB

648samples1.jpg 3KB

1084samples1.jpg 3KB

923samples1.jpg 3KB

3022samples3.jpg 3KB

598samples0.jpg 3KB

1063samples1.jpg 3KB

837samples1.jpg 3KB

574samples0.jpg 3KB

674samples1.jpg 3KB

1204samples1.jpg 3KB

2766samples3.jpg 3KB

2742samples3.jpg 3KB

3032samples3.jpg 3KB

725samples1.jpg 3KB

646samples1.jpg 3KB

1219samples1.jpg 3KB

1414samples1.jpg 3KB

1286samples1.jpg 3KB

2659samples3.jpg 3KB

138samples0.jpg 3KB

2707samples3.jpg 3KB

1285samples1.jpg 3KB

564samples0.jpg 3KB

1877samples2.jpg 3KB

1323samples1.jpg 3KB

2617samples3.jpg 3KB

2654samples3.jpg 3KB

2826samples3.jpg 3KB

20samples0.jpg 3KB

1242samples1.jpg 3KB

共 3053 条

import tensorflow as tf # 网络结构定义,四维参数， # 输入参数：images，image batch、四维张量、tf.float32、[batch_size, width, height, channels] # 返回参数：logits, float、 [batch_size, n_classes] def inference(images, batch_size, n_classes): # 一个简单的卷积神经网络，卷积+池化层x2，全连接层x2，最后一个softmax层做分类。 # 卷积层1 # 64个3x3的卷积核（3通道），padding=’SAME’，表示padding后卷积的图与原图尺寸一致，激活函数为relu() with tf.variable_scope('conv1') as scope: #权重，产生正态分布 weights = tf.Variable(tf.truncated_normal(shape=[3, 3, 3, 64], stddev=1.0, dtype=tf.float32), name='weights', dtype=tf.float32) #偏置，生成值为0.1，shape大小的偏置的值 biases = tf.Variable(tf.constant(value=0.1, dtype=tf.float32, shape=[64]), name='biases', dtype=tf.float32) #卷积函数tf.nn.conv2d,训练数据为images，过滤器为weights conv = tf.nn.conv2d(images, weights, strides=[1, 1, 1, 1], padding='SAME') #加上偏置值 pre_activation = tf.nn.bias_add(conv, biases) #激活函数，将特征值转换到另一个空间，更好的分类，不再是线性简单的结果 conv1 = tf.nn.relu(pre_activation, name=scope.name) # 池化层1 # 3x3最大池化，步长strides为2，池化后执行lrn()操作，局部响应归一化，对训练有利。 # 局部归一化，侧抑制，局部神经元竞争，使响应比较大的值相对更大，提高识别率 with tf.variable_scope('pooling1_lrn') as scope: pool1 = tf.nn.max_pool(conv1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding='SAME', name='pooling1') norm1 = tf.nn.lrn(pool1, depth_radius=4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name='norm1') # 卷积层2 # 16个3x3的卷积核（16通道），padding=’SAME’，表示padding后卷积的图与原图尺寸一致，激活函数relu() with tf.variable_scope('conv2') as scope: weights = tf.Variable(tf.truncated_normal(shape=[3, 3, 64, 16], stddev=0.1, dtype=tf.float32), name='weights', dtype=tf.float32) biases = tf.Variable(tf.constant(value=0.1, dtype=tf.float32, shape=[16]), name='biases', dtype=tf.float32) conv = tf.nn.conv2d(norm1, weights, strides=[1, 1, 1, 1], padding='SAME') pre_activation = tf.nn.bias_add(conv, biases) conv2 = tf.nn.relu(pre_activation, name='conv2') # 池化层2 # 3x3最大池化，步长strides为2，池化后执行lrn()操作， # pool2 and norm2 with tf.variable_scope('pooling2_lrn') as scope: norm2 = tf.nn.lrn(conv2, depth_radius=4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name='norm2') pool2 = tf.nn.max_pool(norm2, ksize=[1, 3, 3, 1], strides=[1, 1, 1, 1], padding='SAME', name='pooling2') # 全连接层1 # 128个神经元，将之前pool层的输出reshape成一行，激活函数relu() with tf.variable_scope('local3') as scope: reshape = tf.reshape(pool2, shape=[batch_size, -1]) dim = reshape.get_shape()[1].value weights = tf.Variable(tf.truncated_normal(shape=[dim, 128], stddev=0.005, dtype=tf.float32), name='weights', dtype=tf.float32) biases = tf.Variable(tf.constant(value=0.1, dtype=tf.float32, shape=[128]), name='biases', dtype=tf.float32) local3 = tf.nn.relu(tf.matmul(reshape, weights) + biases, name=scope.name) # 全连接层2 # 128个神经元，激活函数relu() with tf.variable_scope('local4') as scope: weights = tf.Variable(tf.truncated_normal(shape=[128, 128], stddev=0.005, dtype=tf.float32), name='weights', dtype=tf.float32) biases = tf.Variable(tf.constant(value=0.1, dtype=tf.float32, shape=[128]), name='biases', dtype=tf.float32) local4 = tf.nn.relu(tf.matmul(local3, weights) + biases, name='local4') # dropout层 # with tf.variable_scope('dropout') as scope: # drop_out = tf.nn.dropout(local4, 0.8) # Softmax回归层 # 将前面的FC层输出，做一个线性回归，计算出每一类的得分 with tf.variable_scope('softmax_linear') as scope: weights = tf.Variable(tf.truncated_normal(shape=[128, n_classes], stddev=0.005, dtype=tf.float32), name='softmax_linear', dtype=tf.float32) biases = tf.Variable(tf.constant(value=0.1, dtype=tf.float32, shape=[n_classes]), name='biases', dtype=tf.float32) softmax_linear = tf.add(tf.matmul(local4, weights), biases, name='softmax_linear') return softmax_linear # ----------------------------------------------------------------------------- # 损失值loss计算 # 传入参数：logits，网络计算输出值。labels，真实值，在这里是0或者1 # 返回参数：loss，损失值 def losses(logits, labels): with tf.variable_scope('loss') as scope: cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=labels, name='xentropy_per_example') loss = tf.reduce_mean(cross_entropy, name='loss') tf.summary.scalar(scope.name + '/loss', loss) return loss # -------------------------------------------------------------------------- # loss损失值优化 # 输入参数：loss。learning_rate，学习速率。 # 返回参数：train_op，训练op，这个参数要输入sess.run中让模型去训练。 def trainning(loss, learning_rate): with tf.name_scope('optimizer'): optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate) global_step = tf.Variable(0, name='global_step', trainable=False) train_op = optimizer.minimize(loss, global_step=global_step) return train_op # ----------------------------------------------------------------------- # 评价/准确率计算 # 输入参数：logits，网络计算值。labels，标签，也就是真实值，在这里是0或者1。 # 返回参数：accuracy，当前step的平均准确率，也就是在这些batch中多少张图片被正确分类了。 def evaluation(logits, labels): with tf.variable_scope('accuracy') as scope: correct = tf.nn.in_top_k(logits, labels, 1) correct = tf.cast(correct, tf.float16) accuracy = tf.reduce_mean(correct) tf.summary.scalar(scope.name + '/accuracy', accuracy) return accuracy

评论收藏

内容反馈