基于机器学习对比学习法对MNIST数据集进行预训练和分类源码+项目说明+详细注释.zip

共3个文件

py：1个

npz：1个

md：1个

版权申诉

毕业设计

课程设计

项目源码

课程大作业

135 浏览量 2023-09-25 11:22:01 上传评论收藏 10.97MB ZIP 举报

【资源说明】基于机器学习对比学习法对MNIST数据集进行预训练和分类源码+项目说明+详细注释.zip 对比学习是一种机器学习方法，它利用训练数据中的相似和不同之处来学习分类任务。对比学习的目标是通过将相似样本归为一类、将不同样本归为另一类来学习分类决策边界。这种方法通常用于处理具有少量标注数据的问题，例如人脸识别，图像检索和自然语言处理。 ## 模型构架及训练步骤 1.加载并预处理数据集可以使用本地的数据集，也可以在线下载(需要外网)，建议直接使用本地 ```python # 指定本地路径的方法 from keras.datasets import mnist path = '你的数据集路径' (x_train, y_train), (x_test, y_test) = mnist.load_data(path) # 数据归一化处理 x_train = x_train.astype("float32") / 255.0 x_test = x_test.astype("float32") / 255.0 ``` 2.自定义DataGenerate 在这个类中锚点数据将从数据集中直接按标签取出，将锚点数据送进数据增强器，进行随机旋转、平移、剪切、缩放、翻转等方法。生成正样本。在原有的数据集中选择标签不等于当前标签的数据作为负样本。 3.自定义损失函数采用欧式距离计算正负样本和锚点之间的差异，并设置alpha参数作为阈值当negative样本与anchor样本的距离大于该阈值时，我们认为这样个样本是不匹配的，需要具体问题具体调整。 4.构建预训练网络模型 1>卷积层，使用32个3×3的卷积核，激活函数为ReLU。 2>池化层，使用2×2的池化窗口。 3>卷积层，使用64个3×3的卷积核，激活函数为ReLU。 4>池化层，使用2×2的池化窗口。 5>展平层，将输入的多维数据转换成以为向量。 6>全连接层，输出维度为64，激活函数是ReLU。 ```python encoder = keras.Sequential( [ layers.Conv2D(32, (3, 3), activation="relu", input_shape=input_shape), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, (3, 3), activation="relu"), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(embedding_dim, activation="relu"), ], name="encoder", ) ``` 5.构建MLP模型搭建两个全连接层，输入参数为256，输出类别数，从而实现分类。 ```python mlp_model = keras.Sequential([ layers.Dense(256, activation="relu", input_shape=(embedding_dim,)), layers.Dense(num_classes, activation="softmax") ], name="mlp_model") ``` 6.准确率设置epochs=20，batches=128跑下来准确能够达到0.9179 【备注】 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

资源推荐

资源详情

资源评论

收起资源包目录

基于机器学习对比学习法对MNIST数据集进行预训练和分类源码+项目说明+详细注释.zip （3个子文件）

项目说明.md 3KB

Contrastive_learning_MNIST.py 5KB

mnist.npz 10.96MB

import numpy as np import keras from keras.datasets import mnist from keras.utils import to_categorical import keras.backend as K from keras import layers from keras.optimizers import Adam import matplotlib.pyplot as plt from sklearn.manifold import TSNE from keras.preprocessing.image import ImageDataGenerator import matplotlib matplotlib.use('TkAgg') # 定义超参数 num_classes = 10 # 类别数 input_shape = (28, 28, 1) # 输入形状 batch_size = 128 # 批量大小 epochs = 20 # 轮次 embedding_dim = 64 # 嵌入维度 alpha = 0.1 path = r'D:\新建文件夹\简历项目\使用对比学习对MNIST数据集进行预训练和分类\mnist.npz' # 加载并预处理数据集 (x_train, y_train), (x_test, y_test) = mnist.load_data(path) # 将像素归一化0-1之间 x_train = x_train.astype("float32") / 255.0 x_test = x_test.astype("float32") / 255.0 # 定义数据增强器 data_augmentation = ImageDataGenerator( rotation_range=20, # 随机旋转角度范围 width_shift_range=0.2, # 随机水平平移范围 height_shift_range=0.2, # 随机竖直平移范围 shear_range=0.2, # 随机剪切变换范围 zoom_range=0.2, # 随机缩放范围 horizontal_flip=True, # 随机水平翻转 vertical_flip=True, # 随机竖直翻转 fill_mode='nearest' # 填充模式 ) # 定义损失函数 # 写成闭包是为了传递alpha的值 def contrastive_loss(alpha): """ :param alpha:表示anchor和negative之间为多少时认为他们不匹配 """ def loss(y_true, y_pred): anchor, positive, negative = y_pred[:, 0], y_pred[:, 1], y_pred[:, 2] # 计算欧式距离 # K.sqrt(K.sum(K.square(a - b), axis=-1, keepdims=True)) pos_distance = K.sqrt(K.sum(K.square(anchor - positive), axis=-1)) neg_distance = K.sqrt(K.sum(K.square(anchor - negative), axis=-1)) return K.mean((1 - y_true) * K.square(pos_distance) + y_true * K.square(K.maximum(0.0, alpha - neg_distance))) return loss # 自定义DataGenerator class DataGenerator(keras.utils.Sequence): def __init__(self, x, y, batch_size, num_classes, alpha, data_augmentation): self.x = x self.y = y self.batch_size = batch_size self.num_classes = num_classes self.alpha = alpha self.data_augmentation = data_augmentation # 数据增强器 def __len__(self): return int(np.ceil(len(self.x)) / float(self.batch_size)) def __getitem__(self, index): batch_x = self.x[index * self.batch_size: (index + 1) * self.batch_size] batch_y = self.y[index * self.batch_size: (index + 1) * self.batch_size] anchor = batch_x # 通过对锚点数据进行数据增强生成正样本 positive = self.data_augmentation.flow(anchor, shuffle=False, batch_size=self.batch_size).next() negative = np.zeros_like(anchor) for i in range(self.batch_size): neg_idx = np.random.choice(np.where(self.y != batch_y[i])[0]) negative[i] = self.x[neg_idx] return [anchor, positive, negative], np.zeros((self.batch_size,)) # 构建模型并训练 anchor_input = layers.Input(shape=input_shape, name="anchor_input") positive_input = layers.Input(shape=input_shape, name="positive_input") negative_input = layers.Input(shape=input_shape, name="negative_input") # 建立编码器 encoder = keras.Sequential( [ layers.Conv2D(32, (3, 3), activation="relu", input_shape=input_shape), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, (3, 3), activation="relu"), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(embedding_dim, activation="relu"), ], name="encoder", ) # 将锚点，正样本，负样本传入编码器 encoded_anchor = encoder(anchor_input) encoded_positive = encoder(positive_input) encoded_negative = encoder(negative_input) merged_output = layers.concatenate([encoded_anchor, encoded_positive, encoded_negative], axis=-1, name="merged_layer") model = keras.Model(inputs=[anchor_input, positive_input, negative_input], outputs=merged_output, name="triplet_model") generator = DataGenerator(x_train.reshape(-1, 28, 28, 1), y_train, batch_size, num_classes, alpha, data_augmentation) # 编译模型 model.compile(loss=contrastive_loss(alpha), optimizer=Adam()) model.fit(generator, epochs=epochs) # 获取编码器 encoder = model.get_layer("encoder") # 对测试数据进行编码生成向量 embeddings = encoder.predict(x_test.reshape(-1, 28, 28, 1)) # 使用t-SNE算法对向量进行降维 tsne_embeddings = TSNE(n_components=2).fit_transform(embeddings) # TSNE可视化处理 plt.scatter(tsne_embeddings[:, 0], tsne_embeddings[:, 1], c=y_test) plt.show() x_train_encoded = encoder.predict(x_train.reshape(-1, 28, 28, 1)) x_test_encoded = encoder.predict(x_test.reshape(-1, 28, 28, 1)) # 训练MLP层并进行分类 mlp_model = keras.Sequential([ layers.Dense(256, activation="relu", input_shape=(embedding_dim,)), layers.Dense(num_classes, activation="softmax") ], name="mlp_model") # 编译并训练MLP mlp_model.compile(loss="sparse_categorical_crossentropy", optimizer="adam", metrics=["accuracy"]) mlp_model.fit(x_train_encoded, y_train, batch_size=batch_size, epochs=epochs, validation_data=(x_test_encoded, y_test)) test_loss, test_acc = mlp_model.evaluate(x_test_encoded, y_test) print("Test accuracy:", test_acc)

评论收藏

内容反馈

版权申诉