python字典python-neural-network.rar资源-CSDN文库

共20个文件

py：18个

py_tf：1个

disabled：1个

需积分: 5 132 浏览量 2024-06-13 07:58:00 上传评论收藏 25KB RAR 举报

Python字典是Python编程语言中的一个核心数据结构，它提供了键值对的存储方式，使得通过键（key）快速访问对应的值（value）成为可能。在构建神经网络时，字典常常被用作存储参数、配置或者元数据的有效工具。在“python-neural_network.rar”这个压缩包中，我们可以推测其内容可能包含了关于使用Python实现神经网络的相关教程或代码示例。神经网络是一种模仿人脑神经元工作原理的计算模型，用于学习复杂的数据关系和模式。在Python中，常见的神经网络库有TensorFlow、Keras和PyTorch等。这些库利用了高效的数学计算库如NumPy，以及GPU加速来实现大规模的矩阵运算，从而高效地训练神经网络。 1. **神经网络基础知识**：在Python中，神经网络通常由多个层构成，包括输入层、隐藏层和输出层。每层由多个神经元组成，每个神经元负责计算其接收到的输入的加权和，并通过激活函数转换为非线性输出。激活函数如Sigmoid、ReLU、Tanh等在神经网络中起着至关重要的作用，它们引入非线性，使网络能够学习更复杂的模式。 2. **TensorFlow与Keras**：TensorFlow是Google开发的一个开源库，支持高性能数值计算，常用于机器学习和深度学习。Keras则是一个高级神经网络API，可以运行在TensorFlow之上，简化了模型的构建和训练过程。Keras的高层接口使得初学者能快速搭建和训练神经网络模型。 3. **PyTorch**：PyTorch是Facebook的开源项目，以其动态计算图和直观的API受到许多研究人员的喜爱。它在灵活性和易用性上具有优势，适合进行研究和实验。 4. **构建神经网络模型**：在Python中，我们首先定义模型的架构，包括输入层、隐藏层和输出层的神经元数量，以及各层之间的连接。然后，设置损失函数和优化器，如均方误差（MSE）作为损失函数，梯度下降或Adam作为优化器。通过训练数据集迭代更新模型参数，完成模型的训练。 5. **数据预处理**：在训练神经网络之前，通常需要对数据进行预处理，包括标准化、归一化、填充缺失值、编码分类变量等。这一步对于提高模型性能至关重要。 6. **训练与评估**：模型训练过程中，我们使用训练集进行模型的参数调整，验证集用于检查模型的泛化能力，防止过拟合。训练结束后，使用测试集评估模型的最终性能。 7. **模型保存与预测**：训练好的模型可以保存，以便将来进行预测。Python提供了一些方法来保存和加载模型，比如在TensorFlow中可以使用`.save()`和`.load_weights()`，在PyTorch中则有`.save()`和`.load()`。 8. **调试与调优**：如果模型表现不佳，可以通过调整超参数（如学习率、批次大小、网络层数等）来优化模型。此外，正则化技术如L1、L2正则化或Dropout也能帮助减轻过拟合。 9. **深度学习框架对比**：不同的深度学习框架各有优缺点，选择哪个取决于具体需求。例如，TensorFlow适合大型企业项目，PyTorch则更适合研究和快速原型设计。 10. **实践应用**：Python神经网络广泛应用于图像识别、自然语言处理、推荐系统、自动驾驶等领域，通过不断学习和改进，能够解决越来越多的实际问题。在这个“python-neural_network.rar”压缩包中，可能包含的资源可能涵盖以上部分或全部内容，提供实际代码示例、讲解文档或者教程，帮助学习者理解和实现自己的神经网络模型。

资源推荐

资源详情

资源评论

收起资源包目录

python-neural_network.rar （20个子文件）

neural_network

input_data.py 12KB

__init__.py 0B

two_hidden_layers_neural_network.py 11KB

activation_functions

__init__.py 0B

squareplus.py 1KB

scaled_exponential_linear_unit.py 1KB

rectified_linear_unit.py 1KB

leaky_rectified_linear_unit.py 1KB

exponential_linear_unit.py 1KB

softplus.py 966B

binary_step.py 857B

swish.py 2KB

gaussian_error_linear_unit.py 1KB

mish.py 1KB

soboleva_modified_hyperbolic_tangent.py 2KB

simple_neural_network.py 2KB

perceptron.py.DISABLED 7KB

back_propagation_neural_network.py 6KB

gan.py_tf 16KB

convolution_neural_network.py 14KB

""" - - - - - -- - - - - - - - - - - - - - - - - - - - - - - Name - - CNN - Convolution Neural Network For Photo Recognizing Goal - - Recognize Handing Writing Word Photo Detail: Total 5 layers neural network * Convolution layer * Pooling layer * Input layer layer of BP * Hidden layer of BP * Output layer of BP Author: Stephen Lee Github: 245885195@qq.com Date: 2017.9.20 - - - - - -- - - - - - - - - - - - - - - - - - - - - - - """ import pickle import numpy as np from matplotlib import pyplot as plt class CNN: def __init__( self, conv1_get, size_p1, bp_num1, bp_num2, bp_num3, rate_w=0.2, rate_t=0.2 ): """ :param conv1_get: [a,c,d], size, number, step of convolution kernel :param size_p1: pooling size :param bp_num1: units number of flatten layer :param bp_num2: units number of hidden layer :param bp_num3: units number of output layer :param rate_w: rate of weight learning :param rate_t: rate of threshold learning """ self.num_bp1 = bp_num1 self.num_bp2 = bp_num2 self.num_bp3 = bp_num3 self.conv1 = conv1_get[:2] self.step_conv1 = conv1_get[2] self.size_pooling1 = size_p1 self.rate_weight = rate_w self.rate_thre = rate_t rng = np.random.default_rng() self.w_conv1 = [ np.asmatrix(-1 * rng.random((self.conv1[0], self.conv1[0])) + 0.5) for i in range(self.conv1[1]) ] self.wkj = np.asmatrix(-1 * rng.random((self.num_bp3, self.num_bp2)) + 0.5) self.vji = np.asmatrix(-1 * rng.random((self.num_bp2, self.num_bp1)) + 0.5) self.thre_conv1 = -2 * rng.random(self.conv1[1]) + 1 self.thre_bp2 = -2 * rng.random(self.num_bp2) + 1 self.thre_bp3 = -2 * rng.random(self.num_bp3) + 1 def save_model(self, save_path): # save model dict with pickle model_dic = { "num_bp1": self.num_bp1, "num_bp2": self.num_bp2, "num_bp3": self.num_bp3, "conv1": self.conv1, "step_conv1": self.step_conv1, "size_pooling1": self.size_pooling1, "rate_weight": self.rate_weight, "rate_thre": self.rate_thre, "w_conv1": self.w_conv1, "wkj": self.wkj, "vji": self.vji, "thre_conv1": self.thre_conv1, "thre_bp2": self.thre_bp2, "thre_bp3": self.thre_bp3, } with open(save_path, "wb") as f: pickle.dump(model_dic, f) print(f"Model saved: {save_path}") @classmethod def read_model(cls, model_path): # read saved model with open(model_path, "rb") as f: model_dic = pickle.load(f) # noqa: S301 conv_get = model_dic.get("conv1") conv_get.append(model_dic.get("step_conv1")) size_p1 = model_dic.get("size_pooling1") bp1 = model_dic.get("num_bp1") bp2 = model_dic.get("num_bp2") bp3 = model_dic.get("num_bp3") r_w = model_dic.get("rate_weight") r_t = model_dic.get("rate_thre") # create model instance conv_ins = CNN(conv_get, size_p1, bp1, bp2, bp3, r_w, r_t) # modify model parameter conv_ins.w_conv1 = model_dic.get("w_conv1") conv_ins.wkj = model_dic.get("wkj") conv_ins.vji = model_dic.get("vji") conv_ins.thre_conv1 = model_dic.get("thre_conv1") conv_ins.thre_bp2 = model_dic.get("thre_bp2") conv_ins.thre_bp3 = model_dic.get("thre_bp3") return conv_ins def sig(self, x): return 1 / (1 + np.exp(-1 * x)) def do_round(self, x): return round(x, 3) def convolute(self, data, convs, w_convs, thre_convs, conv_step): # convolution process size_conv = convs[0] num_conv = convs[1] size_data = np.shape(data)[0] # get the data slice of original image data, data_focus data_focus = [] for i_focus in range(0, size_data - size_conv + 1, conv_step): for j_focus in range(0, size_data - size_conv + 1, conv_step): focus = data[ i_focus : i_focus + size_conv, j_focus : j_focus + size_conv ] data_focus.append(focus) # calculate the feature map of every single kernel, and saved as list of matrix data_featuremap = [] size_feature_map = int((size_data - size_conv) / conv_step + 1) for i_map in range(num_conv): featuremap = [] for i_focus in range(len(data_focus)): net_focus = ( np.sum(np.multiply(data_focus[i_focus], w_convs[i_map])) - thre_convs[i_map] ) featuremap.append(self.sig(net_focus)) featuremap = np.asmatrix(featuremap).reshape( size_feature_map, size_feature_map ) data_featuremap.append(featuremap) # expanding the data slice to One dimenssion focus1_list = [] for each_focus in data_focus: focus1_list.extend(self.Expand_Mat(each_focus)) focus_list = np.asarray(focus1_list) return focus_list, data_featuremap def pooling(self, featuremaps, size_pooling, pooling_type="average_pool"): # pooling process size_map = len(featuremaps[0]) size_pooled = int(size_map / size_pooling) featuremap_pooled = [] for i_map in range(len(featuremaps)): feature_map = featuremaps[i_map] map_pooled = [] for i_focus in range(0, size_map, size_pooling): for j_focus in range(0, size_map, size_pooling): focus = feature_map[ i_focus : i_focus + size_pooling, j_focus : j_focus + size_pooling, ] if pooling_type == "average_pool": # average pooling map_pooled.append(np.average(focus)) elif pooling_type == "max_pooling": # max pooling map_pooled.append(np.max(focus)) map_pooled = np.asmatrix(map_pooled).reshape(size_pooled, size_pooled) featuremap_pooled.append(map_pooled) return featuremap_pooled def _expand(self, data): # expanding three dimension data to one dimension list data_expanded = [] for i in range(len(data)): shapes = np.shape(data[i]) data_listed = data[i].reshape(1, shapes[0] * shapes[1]) data_listed = data_listed.getA().tolist()[0] data_expanded.extend(data_listed) data_expanded = np.asarray(data_expanded) return data_expanded def _expand_mat(self, data_mat): # expanding matrix to one dimension list data_mat = np.asarray(data_mat) shapes = np.shape(data_mat) data_expanded = data_mat.reshape(1, shapes[0] * shapes[1]) return data_expanded def _calculate_gradient_from_pool( self, out_map, pd_pool, num_map, size_map, size_pooling ): """ calculate the gradient from the data slice of pool layer pd_pool: list of matrix out_map: the shape of data slice(size_map*size_map) return: pd_all: list of matrix, [num, size_map, size_map] """ pd_all = [] i_pool = 0 for i_map in range(num_map): pd_conv1 = np.ones((size_map, size_map)) for i in range(0, size_map, size_pooling): for j in range(0, size_map, size_pooling): pd_conv1[i : i + size_pooling, j : j + size_pooling] = pd_pool[ i_pool ] i_pool = i_pool + 1 pd_conv2 = np.multiply( pd_conv1, np.multiply(out_map[i_map],

评论收藏

内容反馈