用Python实现了BP神经网络分类算法，根据鸢尾花的4个特征，实现3种鸢尾花的分类.zip

共14个文件

csv：8个

py：6个

版权申诉

199 浏览量 2024-04-10 11:33:30 上传评论收藏 20KB ZIP 举报

在本项目中，我们利用Python编程语言实现了一个BP（Backpropagation）神经网络分类算法，该算法主要用于根据鸢尾花的四个特征数据进行物种分类。鸢尾花数据集是一个经典的多类分类问题，通常用于机器学习算法的演示和测试。在这个案例中，我们将对鸢尾花的萼片长度、萼片宽度、花瓣长度和花瓣宽度这四个特征进行分析，以区分三种鸢尾花：Setosa、Versicolour和Virginica。 BP神经网络是一种监督学习的算法，它通过反向传播误差来调整权重和偏置，以最小化预测结果与真实值之间的差异。该算法适用于非线性可分问题，非常适合处理鸢尾花分类这样的多类问题。我们需要导入必要的Python库，如numpy用于数值计算，pandas用于数据处理，matplotlib用于数据可视化，以及sklearn库中的iris数据集和模型评估工具。接下来，我们将加载鸢尾花数据集，对其进行预处理，包括数据清洗、标准化或归一化，以确保所有特征在同一尺度上。然后，我们将数据集划分为训练集和测试集。通常，我们会采用交叉验证策略来提高模型的泛化能力。在这个例子中，可以使用sklearn的train_test_split函数进行数据划分。接着，我们需要定义神经网络的结构，包括输入层、隐藏层和输出层。每个层的节点数量（即神经元数量）是根据问题的复杂度和特征数量来确定的。在这个案例中，输入层节点数为4（对应鸢尾花的四个特征），隐藏层的节点数可以是任意选择的，而输出层有3个节点，分别对应三种鸢尾花类别。在定义网络结构后，我们需要初始化权重和偏置，然后定义激活函数，通常选择Sigmoid或ReLU。接下来，我们将实现前向传播和反向传播的过程，以计算损失函数（如交叉熵）并更新权重。训练过程中，我们会迭代一定次数（epoch），每次迭代都会遍历整个训练集，调整权重以减少损失。为了防止过拟合，我们可能还会添加正则化项或使用早停策略。训练完成后，我们用测试集评估模型的性能，常用的评估指标有准确率、精确率、召回率和F1分数。我们可以使用模型对新的鸢尾花样本进行预测。在压缩包文件"iris_classification_BPNeuralNetwork-master"中，可能包含了以下文件： 1. 数据加载和预处理的脚本（如`data_preprocessing.py`） 2. 神经网络模型的定义和训练代码（如`bp_neural_network.py`） 3. 模型评估和结果展示的脚本（如`evaluate_model.py`） 4. 可能还会有数据集和训练结果的文件通过学习这个项目，你可以深入了解如何在Python环境中构建和应用BP神经网络解决实际问题，同时提升你在数据处理、模型训练和评估方面的技能。

资源推荐

资源详情

资源评论

收起资源包目录

用Python实现了BP神经网络分类算法，根据鸢尾花的4个特征，实现3种鸢尾花的分类.zip （14个子文件）

iris_classification_BPNeuralNetwork-master

原始数据集

iris.csv 3KB

iris_data_decision_tree_sklearn.py 2KB

iris_data_knn_sklearn.py 2KB

iris_data_classification_bpnn_V2.py 8KB

bpnn_V2数据集

iris_training.csv 2KB

iris_test.csv 628B

iris_data_classification_bpnn_V1.py 8KB

sklearn数据集

iris.csv 3KB

iris_data_classification_knn.py 5KB

格式处理数据集

iris.csv 4KB

iris_data_cluster_sklearn.py 664B

KNN数据集

iris.csv 3KB

bpnn_V1数据集

iris_training.csv 2KB

iris_test.csv 562B

import pandas as pd import numpy as np import datetime import matplotlib.pyplot as plt from pandas.plotting import radviz ''' 构建一个具有1个隐藏层的神经网络，隐层的大小为10 输入层为4个特征，输出层为3个分类 (1,0,0)为第一类，(0,1,0)为第二类，(0,0,1)为第三类 ''' # 1.初始化参数 def initialize_parameters(n_x, n_h, n_y): np.random.seed(2) # 权重和偏置矩阵 w1 = np.random.randn(n_h, n_x) * 0.01 b1 = np.zeros(shape=(n_h, 1)) w2 = np.random.randn(n_y, n_h) * 0.01 b2 = np.zeros(shape=(n_y, 1)) # 通过字典存储参数 parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2} return parameters # 2.前向传播 def forward_propagation(X, parameters): w1 = parameters['w1'] b1 = parameters['b1'] w2 = parameters['w2'] b2 = parameters['b2'] # 通过前向传播来计算a2 z1 = np.dot(w1, X) + b1 # 这个地方需注意矩阵加法：虽然(w1*X)和b1的维度不同，但可以相加 a1 = np.tanh(z1) # 使用tanh作为第一层的激活函数 z2 = np.dot(w2, a1) + b2 a2 = 1 / (1 + np.exp(-z2)) # 使用sigmoid作为第二层的激活函数 # 通过字典存储参数 cache = {'z1': z1, 'a1': a1, 'z2': z2, 'a2': a2} return a2, cache # 3.计算代价函数 def compute_cost(a2, Y): m = Y.shape[1] # Y的列数即为总的样本数 # 采用交叉熵（cross-entropy）作为代价函数 logprobs = np.multiply(np.log(a2), Y) + np.multiply((1 - Y), np.log(1 - a2)) cost = - np.sum(logprobs) / m return cost # 4.反向传播（计算代价函数的导数） def backward_propagation(parameters, cache, X, Y): m = Y.shape[1] w2 = parameters['w2'] a1 = cache['a1'] a2 = cache['a2'] # 反向传播，计算dw1、db1、dw2、db2 dz2 = a2 - Y dw2 = (1 / m) * np.dot(dz2, a1.T) db2 = (1 / m) * np.sum(dz2, axis=1, keepdims=True) dz1 = np.multiply(np.dot(w2.T, dz2), 1 - np.power(a1, 2)) dw1 = (1 / m) * np.dot(dz1, X.T) db1 = (1 / m) * np.sum(dz1, axis=1, keepdims=True) grads = {'dw1': dw1, 'db1': db1, 'dw2': dw2, 'db2': db2} return grads # 5.更新参数 def update_parameters(parameters, grads, learning_rate=0.4): w1 = parameters['w1'] b1 = parameters['b1'] w2 = parameters['w2'] b2 = parameters['b2'] dw1 = grads['dw1'] db1 = grads['db1'] dw2 = grads['dw2'] db2 = grads['db2'] # 更新参数 w1 = w1 - dw1 * learning_rate b1 = b1 - db1 * learning_rate w2 = w2 - dw2 * learning_rate b2 = b2 - db2 * learning_rate parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2} return parameters # 建立神经网络 def nn_model(X, Y, n_h, n_input, n_output, num_iterations=10000, print_cost=False): np.random.seed(3) n_x = n_input # 输入层节点数 n_y = n_output # 输出层节点数 # 1.初始化参数 parameters = initialize_parameters(n_x, n_h, n_y) # 梯度下降循环 for i in range(0, num_iterations): # 2.前向传播 a2, cache = forward_propagation(X, parameters) # 3.计算代价函数 cost = compute_cost(a2, Y) # 4.反向传播 grads = backward_propagation(parameters, cache, X, Y) # 5.更新参数 parameters = update_parameters(parameters, grads) # 每1000次迭代，输出一次代价函数 if print_cost and i % 1000 == 0: print('迭代第%i次，代价函数为：%f' % (i, cost)) return parameters # 6.模型评估 def predict(parameters, x_test, y_test): w1 = parameters['w1'] b1 = parameters['b1'] w2 = parameters['w2'] b2 = parameters['b2'] z1 = np.dot(w1, x_test) + b1 a1 = np.tanh(z1) z2 = np.dot(w2, a1) + b2 a2 = 1 / (1 + np.exp(-z2)) # 结果的维度 n_rows = y_test.shape[0] n_cols = y_test.shape[1] # 预测值结果存储 output = np.empty(shape=(n_rows, n_cols), dtype=int) for i in range(n_rows): for j in range(n_cols): if a2[i][j] > 0.5: output[i][j] = 1 else: output[i][j] = 0 print('预测结果：', output) print('真实结果：', y_test) count = 0 for k in range(0, n_cols): if output[0][k] == y_test[0][k] and output[1][k] == y_test[1][k] and output[2][k] == y_test[2][k]: count = count + 1 else: print('错误分类样本的序号：', k + 1) acc = count / int(y_test.shape[1]) * 100 print('准确率：%.2f%%' % acc) return output # 7.结果可视化 # 特征有4个维度，类别有1个维度，一共5个维度，故采用了RadViz图 def result_visualization(x_test, y_test, result): cols = y_test.shape[1] y = [] pre = [] # 反转换类别的独热编码 for i in range(cols): if y_test[0][i] == 0 and y_test[1][i] == 0 and y_test[2][i] == 1: y.append('setosa') elif y_test[0][i] == 0 and y_test[1][i] == 1 and y_test[2][i] == 0: y.append('versicolor') elif y_test[0][i] == 1 and y_test[1][i] == 0 and y_test[2][i] == 0: y.append('virginica') for j in range(cols): if result[0][j] == 0 and result[1][j] == 0 and result[2][j] == 1: pre.append('setosa') elif result[0][j] == 0 and result[1][j] == 1 and result[2][j] == 0: pre.append('versicolor') elif result[0][j] == 1 and result[1][j] == 0 and result[2][j] == 0: pre.append('virginica') else: pre.append('unknown') # 将特征和类别矩阵拼接起来 real = np.column_stack((x_test.T, y)) prediction = np.column_stack((x_test.T, pre)) # 转换成DataFrame类型，并添加columns df_real = pd.DataFrame(real, index=None, columns=['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width', 'Species']) df_prediction = pd.DataFrame(prediction, index=None, columns=['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width', 'Species']) # 将特征列转换为float类型，否则radviz会报错 df_real[['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width']] = df_real[['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width']].astype(float) df_prediction[['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width']] = df_prediction[['Sepal Length', 'Sepal Width', 'Petal Length', 'Petal Width']].astype(float) # 绘图 plt.figure('真实分类') radviz(df_real, 'Species', color=['blue', 'green', 'red', 'yellow']) plt.figure('预测分类') radviz(df_prediction, 'Species', color=['blue', 'green', 'red', 'yellow']) plt.show() if __name__ == "__main__": # 读取数据 data_set = pd.read_csv('E:\\GitHub\\iris_classification_BPNeuralNetwork\\bpnn_V2数据集\\iris_training.csv', header=None) # 第1种取数据方法： X = data_set.iloc[:, 0:4].values.T # 前四列是特征，T表示转置 Y = data_set.iloc[:, 4:].values.T # 后三列是标签 # 第2种取数据方法： # X = data_set.ix[:, 0:3].values.T # Y = data_set.ix[:, 4:6].values.T # 第3种取数据方法： # X = data_set.loc[:, 0:3].values.T # Y = data_set.loc[:, 4:6].values.T # 第4种取数据方法： # X = data_set[data_set.columns[0:4]].values.T # Y = data_set[data_set.columns[4:7]].values.T Y = Y.astype('uint8') # 开始训练 start_time = datetime.datetime.now() # 输入4个节点，隐层10个节点，输出3个节点，迭代10000次 parameters = nn_model(X, Y, n_h=10, n_input=4, n_output=3, num_iterations=10000, print_cost=True) end_time = datetime.datetime.now() print("用时：" + str((end_time - start_time).seconds) + 's' + str(round((end_time - start_time).microseconds / 1000)) + 'ms') # 对模型进行测试 data_test = pd.read_csv('E:\\GitHub\\iris_classi

评论收藏

内容反馈

版权申诉