基于Keras的CNN入门级Python实现（附多个代码）_cifar10数据集csv格式资源-CSDN文库

共6个文件

py：6个

需积分: 50 80 浏览量 2019-06-01 14:32:00 上传评论 9 收藏 7KB RAR 举报

**基于Keras的CNN入门级Python实现** 在深度学习领域，卷积神经网络（Convolutional Neural Networks，简称CNN）是处理图像识别和计算机视觉任务的首选模型。Keras是一个高级神经网络API，构建在TensorFlow、Theano和CNTK等后端之上，以其简洁易用的接口和强大的功能而受到广泛欢迎。对于初学者而言，Keras是学习CNN的绝佳平台。本文将详细介绍如何使用Keras实现CNN，并结合MNIST、CIFAR和TITANIC三个数据集提供实际代码示例。 **1. Keras基础知识** Keras的核心理念是模块化，它提供了多种预定义的层（如卷积层、池化层、全连接层等），这些层可以方便地组合起来构建复杂的神经网络模型。以下是一些关键概念： - **Sequential模型**：这是Keras中最基础的模型，通过顺序堆叠层来构建模型。 - **Functional API**：更灵活的模型构建方式，允许非线性依赖和多输入/输出模型。 **2. CNN的基本结构** CNN通常由以下几个部分组成： - **卷积层(Conv2D)**：应用卷积核对输入进行特征提取。 - **池化层(MaxPooling)**：用于降低空间维度，提高计算效率，减少过拟合风险。 - **激活函数(ReLU, Leaky ReLU等)**：引入非线性，增加模型表达能力。 - **全连接层(Dense)**：将特征图转换为分类或回归的输出。 - **损失函数**：衡量模型预测与真实值的差距，如交叉熵损失。 - **优化器**：更新权重的策略，如Adam、SGD等。 - **评估指标**：如准确率、精确率、召回率等。 **3. MNIST数据集** MNIST是手写数字识别的经典数据集，包含60000个训练样本和10000个测试样本。使用Keras实现CNN识别MNIST的代码如下： ```python from keras.datasets import mnist from keras.models import Sequential from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense # 数据预处理 (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train = x_train.reshape(-1, 28, 28, 1).astype('float32') / 255 x_test = x_test.reshape(-1, 28, 28, 1).astype('float32') / 255 y_train = keras.utils.to_categorical(y_train, 10) y_test = keras.utils.to_categorical(y_test, 10) # 构建模型 model = Sequential() model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1))) model.add(MaxPooling2D(pool_size=(2, 2))) model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dense(10, activation='softmax')) # 编译模型 model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy']) # 训练模型 model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test)) # 评估模型 score = model.evaluate(x_test, y_test, verbose=0) print('Test loss:', score[0]) print('Test accuracy:', score[1]) ``` **4. CIFAR数据集** CIFAR-10和CIFAR-100是两个小型彩色图像数据集，用于识别物体。每个数据集包含10个或100个类别，各60000张32x32像素的图片。使用Keras处理CIFAR数据集时，通常需要更复杂的模型结构和数据增强： ```python from keras.datasets import cifar10 from keras.applications.vgg16 import VGG16 from keras.models import Model from keras.layers import Dense from keras.preprocessing.image import ImageDataGenerator # 加载数据 (x_train, y_train), (x_test, y_test) = cifar10.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0 # 创建模型 base_model = VGG16(weights=None, include_top=False, input_shape=(32, 32, 3)) for layer in base_model.layers[:15]: layer.trainable = False x = base_model.output x = GlobalAveragePooling2D()(x) x = Dense(1024, activation='relu')(x) predictions = Dense(10, activation='softmax')(x) model = Model(inputs=base_model.input, outputs=predictions) # 编译模型 model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 数据增强 train_datagen = ImageDataGenerator( rotation_range=15, width_shift_range=0.1, height_shift_range=0.1, shear_range=0.1, zoom_range=0.1, horizontal_flip=True, fill_mode='nearest') # 训练模型 history = model.fit(train_datagen.flow(x_train, y_train, batch_size=64), epochs=50, validation_split=0.1) # 评估模型 test_loss, test_acc = model.evaluate(x_test, y_test) print('Test accuracy:', test_acc) ``` **5. TITANIC数据集** TITANIC数据集是用于生存预测的经典数据集，不涉及图像处理，但我们可以使用Keras构建一个简单的全连接神经网络模型： ```python import pandas as pd from keras.models import Sequential from keras.layers import Dense from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler # 加载数据 data = pd.read_csv('titanic.csv') X = data.drop(['Survived', 'PassengerId'], axis=1) y = data['Survived'] # 特征缩放 scaler = StandardScaler() X = scaler.fit_transform(X) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 构建模型 model = Sequential() model.add(Dense(16, activation='relu', input_dim=X_train.shape[1])) model.add(Dense(8, activation='relu')) model.add(Dense(1, activation='sigmoid')) # 编译模型 model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy']) # 训练模型 model.fit(X_train, y_train, epochs=100, batch_size=32, validation_data=(X_test, y_test)) # 评估模型 score = model.evaluate(X_test, y_test) print('Test loss:', score[0]) print('Test accuracy:', score[1]) ``` 以上就是使用Keras实现CNN的基础知识和实际操作，涵盖了从数据预处理到模型构建、训练和评估的完整流程。通过这三个示例，初学者可以快速掌握Keras在图像识别和分类问题上的应用。

资源推荐

资源详情

资源评论

收起资源包目录

cnn.rar （6个子文件）

cnn

CIFAR_CNN2.py 3KB

TITANIC.py 294B

CIFAR_CNN1.py 3KB

MNIST_CNN.py 3KB

MNIST_2.py 2KB

MNIST_1.py 3KB

# -*- coding:utf-8 -*- #建立只有一个隐藏层的神经网络，并具有预测和多种参数输出说明 import numpy as np import pandas as pd from keras.utils import np_utils from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense from keras.layers import Dropout import matplotlib.pyplot as plt # np.random.seed(10) #读取MNIST数据集 (x_train_image,y_train_label),(x_test_image,y_test_label) = mnist.load_data() #显示多项数字图像的images和labels def plot_images_labels_prediction(images,labels,prediction,idx,num=10): #设置显示图像大小 fig = plt.gcf() fig.set_size_inches(12,14) #显示数据项数默认为10，不得超过25 if num>25:num=25 for i in range(0,num): ax = plt.subplot(5,5,1+i) #显示图像 ax.imshow(images[idx],cmap='binary') title = "label="+str(labels[idx]) if len(prediction)>0: title+=",predict="+str(prediction[idx]) ax.set_title(title,fontsize=10) #不现实刻度 ax.set_xticks([]);ax.set_yticks([]) idx+=1 plt.show() #显示训练过程 def show_train_history(train_history,train,validation): plt.plot(train_history.history[train]) plt.plot(train_history.history[validation]) plt.title('Train History') plt.ylabel(train) plt.xlabel('Epoch') plt.legend(['train','validation'],loc='upper left') #显示图例 plt.show() #将原始28*28的二维数字图像转化为一维向量 x_train = x_train_image.reshape(60000,784).astype('float32') x_test = x_test_image.reshape(10000,784).astype('float32') #images的数字标准化 x_train_normalize = x_train/255 x_test_normalize = x_test/255 #标签进行One-Hot编码 y_train_onehot = np_utils.to_categorical(y_train_label) y_test_onehot = np_utils.to_categorical(y_test_label) model = Sequential() #隐含层神经元个数是256，输入层神经元为784，weight和bias由正态分布随机数初始化，激活函数为relu model.add(Dense(units=256,input_dim=784,kernel_initializer='normal',activation='relu')) #加入DropOut层避免过度拟合 model.add(Dropout(0.5)) #添加输出层 model.add(Dense(units=10,kernel_initializer='normal',activation='softmax')) # print(model.summary()) #输出模型概要 #定义训练方式(交叉熵的loss函数，adam优化器，metrics是评估模型准确率) model.compile(loss='categorical_crossentropy',optimizer='adam',metrics=['accuracy']) #开始训练（输入参数；validation_split表示80%训练集，20%测试集；epochs表示周期，每一批次训练batch_size项数据；verbose显示训练过程） train_history=model.fit(x=x_train_normalize,y=y_train_onehot,validation_split=0.2,epochs=10,batch_size=200,verbose=2) show_train_history(train_history,'acc','val_acc') #test数据评估模型准确率 scores=model.evaluate(x_test_normalize,y_test_onehot) # print('accuracy=',scores[1]) #运用模型执行预测 prediction=model.predict_classes(x_test) # print(prediction) plot_images_labels_prediction(x_test_image,y_test_label,prediction,idx=340) #建立混淆矩阵 cross = pd.crosstab(y_test_label,prediction,rownames=['label'],colnames=['prediction']) print(cross)

评论收藏

内容反馈