Tensorflow2.0：加载与识别经典数据集MINIST_tfds.load本地数据集资源-CSDN文库

flow

88 浏览量 2021-01-20 11:35:12 上传评论收藏 72KB PDF 举报

资源详情

资源评论

资源推荐

Tensorflow2.0：加载与识别经典数据集：加载与识别经典数据集MINIST

一一实现思路实现思路

1. 加载加载 MNIST 数据集，得到训练集与测试集数据集，得到训练集与测试集

2. 将训练集与测试集转换为将训练集与测试集转换为DataSet对象对象

3. 将数据顺序打散将数据顺序打散

避免每次读取数据顺序相同，使得模型记住训练集的一些特点，降低模型泛化能力。

4. 设置批训练设置批训练

从训练集总数中随机抽取batchsize个样本，来进行模型训练，相比于使用所用样本构建模型，批训练花费的时间更少，计算

效率更高。每训练一个次，就叫一个step，当经历若干个step使得把训练集所有样本训练过以后，那叫一个epoch

5. 数据预处理数据预处理

图片像素值进行标准化，使得处于0到1的区间

图片的类别转化成one-hot编码

图片的标签是数字0到数字10，是属于多分类问题，为了能够量化类别，将图片的类别转化成长度为10位数字的one-hot编

码，便于和神经网络输出结果比较，计算其损失。

6. 神经网络构建神经网络构建

其主要的流程为：

设置学习率

网络结构参数初始化

计算前向传播

计算损失函数

计算梯度

根据梯度更新参数（梯度下降法）

每经过固定的step记录和输出训练误差，即均方根误差

每经过固定的step，输出测试误差，即分类正确率

二二实现方式实现方式

1.数据处理阶段数据处理阶段

import tensorflow as tf

from tensorflow import keras

from tensorflow.keras import datasets # 导入经典数据集加载模块

# 1. 加载 MNIST 数据集

(x, y), (x_test, y_test) = datasets.mnist.load_data() # 返回数组的形状

# 2. 将数据集转换为DataSet对象，不然无法继续处理

train_db = tf.data.Dataset.from_tensor_slices((x, y))

# print(train_db) #

# 3. 将数据顺序打散

train_db = train_db.shuffle(10000) # 数字为缓冲池的大小

# print(train_db) #

# 4. 设置批训练

train_db = train_db.batch(512) # batch size 为 128

# print(train_db) #

# 5. 预处理函数

def preprocess(x, y): # 输入x的shape 为[b, 32, 32], y为[b] # 将像素值标准化到 0~1区间

x = tf.cast(x, dtype=tf.float32) / 255.

# 将图片改为28*28大小的

x = tf.reshape(x, [-1, 28 * 28])

# 这个reshape我认为是和数据的存储顺序发生冲突，读取的数据应该不是原图的数据，而是被打乱的数据

# 将数据集的类别标签(数字0-10)转换为one-hot 编码

y = tf.cast(y, dtype=tf.int32) # 转成整型张量

y = tf.one_hot(y, depth=10)

return x, y

# 将数据集传入预处理函数，train_db支持map映射函数

train_db = train_db.map(preprocess)

# print(train_db) #

# 设置训练20个epoch

train_db = train_db.repeat(20) # 将train_db在内部迭代20遍

# 查看train_db的结构

x, y = next(iter(train_db))

print(x, y)

print('train sample:', x.shape, y.shape) # (512, 784) (512, 10)

# 从上面可以看出，现在的train_db已经变成可每份512*784的矩阵，有变成了每份512*10的矩阵，784表示输入的特征

数，10表示输出的类别所对应的向量，即one-hot编码

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

评论收藏

内容反馈

weixin_38746818

粉丝: 7
资源: 910

Tensorflow2.0：加载与识别经典数据集MINIST

评论0

最新资源

Tensorflow2.0：加载与识别经典数据集MINIST

评论0

tensorflow2.0实现mnist手写数字识别代码

Tensorflow2.0：实战LeNet-5识别MINIST数据集

MnistDataSet加载方法

tensorflow 训练 MNIST数据集

TensorFlow2版本的mnist手写数字识别

基于MATLAB的MINIST数据库数据手写体识别-源码

MINIST数据集识别代码（基于CNN与FullyCNN模型）

MINIST数据手写体识别.zip_MINIST数据手写体识别_minist 自己手写_prettyreh_simpledkz_

基于MATLAB的MINIST数据库数据手写体识别，matlab2021a仿真测试。

基于Python和PyTorch框架完成的一个手写数字识别实验源码(带MINIST手写数字数据集).zip

imgClassifier - 副本_equipment4co_tensorflow2.0_tensorflow2_图像识别分类

tensorflow中keras支持的mnist数据集

TensorFlow利用卷积神经网络识别手写数据集MNIST

tensorflow基础教程中所用mnist数据集

Tensorflow2.0导入数据集的方法汇总

tensorflow读取数据集代码

TensorFlow的数据集Minist

基于pytorch+MINIST实现手写数字识别源码+数据集（高分毕业设计）.zip

tensorflow minist数据集

基于卷积神经网络实现minist数据集分类附matlab代码

基于TensorFlow深度学习的Minist手写数字识别技术.pdf

运用贝叶斯决策理论实现手写数字识别（代码+minist数据集）

minist手写数字数据集（含代码）

MINIST数据集完全版

minist手写数字数据集(原始图片)

基于Tensorflow的CNN数字识别.zip_MINIST_cnn minist_cnn python_cnn 手写_cnn

模式识别：三种方法进行手写数字识别程序包（附带minist数据集）.zip

MNIST_data_机器学习_MNIST数据集_minist数据集_MNIST_

课程数据集_Kmeans_K._minist数据集_数据集_

最新资源