感知原始形式python3源代码资源-CSDN文库

共8个文件

xml：3个

py：2个

trainingdata：1个

人工智能

机器学习

二分分类

线性分类

需积分: 50 81 浏览量 2018-11-07 20:50:52 上传评论 2 收藏 14KB ZIP 举报

在IT领域，特别是机器学习和人工智能的分支，感知机（Perceptron）是一种基础且重要的算法。本资源包“感知原始形式python3源代码”包含了训练数据和与感知机相关的Python3源代码，旨在帮助开发者理解和实现这个经典的学习模型。感知机是最早的监督式学习算法之一，主要用于二分分类问题，即数据可以被分为两个明确的类别。它是线性分类模型，能够找到一个超平面来将两类数据分开。在这个压缩包中，你可能会发现以下几个关键部分： 1. **训练数据**：通常以二维或高维数组的形式存在，用于训练感知机模型。数据应包含特征向量和对应的类别标签。这些数据将被输入到感知机算法中，以便它学习如何正确地划分不同类别的实例。 2. **感知机函数**：在Python3源代码中，会有实现感知机算法的函数。这通常包括初始化权重、更新权重规则（根据误分类样本进行调整）、预测函数等。感知机的更新规则基于梯度下降，每次迭代都会调整权重，使得误分类样本的误差减小。 3. **训练过程**：训练代码会调用上述感知机函数，通过迭代学习来不断优化权重。在训练过程中，模型会尝试找到最佳的超平面，以最大化两类样本的间隔。 4. **可视化工具**：为了更好地理解模型的性能和学习过程，可视化功能是必不可少的。这些可能包括散点图，显示数据点在特征空间中的分布，以及超平面如何将它们分开。此外，还可以通过学习曲线来观察模型的收敛情况。 5. **测试与评估**：除了训练，代码还可能包含了测试部分，用于评估模型在未见过的数据上的表现。常见的评估指标有准确率、精确率、召回率和F1分数等。通过学习和实践这个“感知原始形式python3源代码”，你可以深入理解感知机的工作原理，掌握如何用Python编程语言实现它，并了解在实际问题中如何应用线性分类模型。同时，这也将有助于你为更复杂的机器学习算法打下坚实的基础，如支持向量机(SVM)、神经网络等。在探索这个资源包时，建议结合理论知识，逐步调试代码，观察模型的行为变化，以获得更全面的理解。

资源推荐

资源详情

资源评论

收起资源包目录

python3感知机原始形式案例.zip （8个子文件）

python3感知机原始形式案例

perceptron_functions.py 5KB

perceptron_main.py 585B

trainingData 5KB

.idea

misc.xml 294B

workspace.xml 20KB

感知机.iml 408B

inspectionProfiles

modules.xml 277B

__pycache__

perceptron_functions.cpython-36.pyc 4KB

import numpy as np import matplotlib.pyplot as plt import random def load_file(filename): """ input:filename(string)训练数据的位置 output：feature_data(mat)特征 label_data(mat)标签 """ f = open(filename) # 打开文件 feature_data = [] label_data = [] for line in f.readlines(): feature_tmp = [] label_tmp = [] lines = line.strip().split('\t') # strip移除末尾换行符 #通过指定分隔符对字符串进行切片 for i in range(len(lines) - 1): feature_tmp.append(float(lines[i])) label_tmp.append(float(lines[-1])) feature_data.append(feature_tmp) label_data.append(label_tmp) f.close() return np.mat(feature_data), np.mat(label_data) def save_model(filename, w): """ 保存最终的模型 :param filename(string):模型保存的文件名 :param w(mat):LR模型的权重 :return: """ m = np.shape(w)[0] f_w = open(filename, 'w') w_array = [] for i in range(m): w_array.append(str(w[i, 0])) f_w.write('\t'.join(w_array)) f_w.close() def sign(x): """ 决策函数 :param x:（float）预测值 :return:属于的类 """ if x > 0: return 1 else: return -1 def training(feature_data, label_data, weights, biases, learning_rate, iter_num): """ 训练函数 :param feature_data:（mat）输入的特征 :param label_data:（mat）输入的特征 :param weights:（mat）权重系数 :param biases:（float）偏置量 :param learning_rate:（float）学习速率 :param iter_num:（int）迭代次数 :return: """ for index in range(iter_num): # 随机从样本中选取一个点，计算预测值 tmp_index = random.choice(range(np.shape(feature_data)[0])) tmp_feature = feature_data[tmp_index, :] y = label_data[tmp_index] predict = sign(tmp_feature * weights + biases) if y * predict <= 0: weights = weights + learning_rate * tmp_feature.T * y biases = biases + learning_rate * y if index % 10 == 0: obj_value = objective_function(feature_data, label_data, weights, biases) print("\t-----------iter = " + str(index) + \ " , train error rate = " + str(obj_value[0, 0])) return weights, biases def initial(): """ 初始化相关参数 :return:（int）迭代次数，（float）学习速率，（mat）初始权重， """ iter_num = 1000 # 初始值设置的不好的时候，迭代次数需要设置的很大 learning_rate = 1 weights = np.mat(np.ones((2, 1))) biases = 0 return np.mat(weights), biases, learning_rate, iter_num def plot_points_line(feature, label, weights, bias): """ 输入数据点特征，标签，权重系数，偏移值，画出散点图和感知机训练得到的分类直线 :param feature_data: :param label_data: :param weights: :param bias: :return: """ point_red = [] point_blue = [] point_yellow = [] point_green = [] r = np.shape(feature)[0] for index in range(r): temp = -2 # 从右到左第二个数 if label[index] == 0: point_red.append(feature[index, temp]) point_red.append(feature[index, temp + 1]) # 如果一次放两个元素feature[index, 1:3]，会被当做一个整体存放在list中 elif label[index] == 1: point_blue.append(feature[index, temp]) point_blue.append(feature[index, temp + 1]) elif label[index] == 2: point_yellow.append(feature[index, temp]) point_yellow.append(feature[index, temp + 1]) else: point_green.append(feature[index, temp]) point_green.append(feature[index, temp + 1]) # 画出图形 point_red = np.mat(point_red).reshape(-1, 2) # list转换成一维矩阵，再转换成二维矩阵 point_blue = np.mat(point_blue).reshape(-1, 2) point_green = np.mat(point_green).reshape(-1, 2) point_yellow = np.mat(point_yellow).reshape(-1, 2) # 画散点图 plt.scatter(point_red[:, 0].tolist(), point_red[:, 1].tolist(), c='r') # scatter函数只接受list，不接受matrix plt.scatter(point_blue[:, 0].tolist(), point_blue[:, 1].tolist(), c='b') plt.scatter(point_green[:, 0].tolist(), point_green[:, 1].tolist(), c='g') plt.scatter(point_yellow[:, 0].tolist(), point_yellow[:, 1].tolist(), c='y') # 画直线 line_x = np.linspace(-1, 10, 100) line_y = -(weights[0] * line_x + bias) / weights[1] plt.plot(line_x, line_y.T) plt.show() def objective_function(feature_data, label, weights, biases): """ 计算目标函数的值 :param feature_data:（mat）特征 :param label:（mat）标签 :param weights:（mat）权重 :param biases:（float）偏移量 :return:（float）目标函数的值 """ m = np.shape(feature_data)[0] obj_value = np.mat(np.zeros((1, 1))) for index in range(m): tmp_value = - label[index] * (feature_data[index] * weights + biases) if tmp_value > 0: obj_value += tmp_value return obj_value

评论收藏

内容反馈