sklearn和keras的数据切分与交叉验证的实例详解

keras

93 浏览量 2020-12-17 07:34:16 上传评论 1 收藏 62KB PDF 举报

资源详情

资源评论

资源推荐

sklearn和和keras的数据切分与交叉验证的实例详解的数据切分与交叉验证的实例详解

在训练深度学习模型的时候，通常将数据集切分为训练集和验证集．Keras提供了两种评估模型性能的方法：

使用自动切分的验证集

使用手动切分的验证集

一．自动切分一．自动切分

在Keras中，可以从数据集中切分出一部分作为验证集，并且在每次迭代(epoch)时在验证集中评估模型的性能．

具体地，调用model.fit()训练模型时，可通过validation_split参数来指定从数据集中切分出验证集的比例．

# MLP with automatic validation set

from keras.models import Sequential

from keras.layers import Dense

import numpy

# fix random seed for reproducibility

numpy.random.seed(7)

# load pima indians dataset

dataset = numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")

# split into input (X) and output (Y) variables

X = dataset[:,0:8] Y = dataset[:,8] # create model

model = Sequential()

model.add(Dense(12, input_dim=8, activation='relu'))

model.add(Dense(8, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

# Compile model

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# Fit the model

model.fit(X, Y, validation_split=0.33, epochs=150, batch_size=10)

validation_split：0~1之间的浮点数，用来指定训练集的一定比例数据作为验证集。验证集将不参与训练，并在每个epoch结束

后测试的模型的指标，如损失函数、精确度等。

注意，validation_split的划分在shuffle之前，因此如果你的数据本身是有序的，需要先手工打乱再指定validation_split，否则

可能会出现验证集样本不均匀。

二．手动切分二．手动切分

Keras允许在训练模型的时候手动指定验证集．

例如，用sklearn库中的train_test_split()函数将数据集进行切分，然后在keras的model.fit()的时候通过validation_data参数指定

前面切分出来的验证集．

# MLP with manual validation set

from keras.models import Sequential

from keras.layers import Dense

from sklearn.model_selection import train_test_split

import numpy

# fix random seed for reproducibility

seed = 7

numpy.random.seed(seed)

# load pima indians dataset

dataset = numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")

# split into input (X) and output (Y) variables

X = dataset[:,0:8] Y = dataset[:,8] # split into 67% for train and 33% for test

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=seed)

# create model

model = Sequential()

model.add(Dense(12, input_dim=8, activation='relu'))

model.add(Dense(8, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

# Compile model

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# Fit the model

model.fit(X_train, y_train, validation_data=(X_test,y_test), epochs=150, batch_size=10)

三．三．K折交叉验证（折交叉验证（k-fold cross validation））

将数据集分成k份，每一轮用其中(k-1)份做训练而剩余1份做验证，以这种方式执行k轮，得到k个模型．将k次的性能取平均，

作为该算法的整体性能．k一般取值为5或者10．

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

weixin_38658982

粉丝: 7
资源: 941

sklearn和keras的数据切分与交叉验证的实例详解

评论0

最新资源

sklearn和keras的数据切分与交叉验证的实例详解

评论0

minist+CNN+交叉验证

keras实现cifar-10图片分类

十折交叉验证程序

使用sklearn的cross_val_score进行交叉验证实例

Python sklearn KFold 生成交叉验证数据集的方法

机器学习入门与实战(scikit-learn和Keras)课件—GAN网络.pdf

3.1 Keras数据加载与增强.py

Python-使用sklearnpytorch和keras进行mnist手写数字分类的教程

keras 神经网络解决回归问题实例_波士顿房价预测.rar

Keras 利用sklearn的ROC-AUC建立评价函数详解

sklearn-audio-classification：对RAVDESS数据集上的音频分类进行深入分析。 使用多种ML技术和MLP进行特征工程，超参数优化，模型评估和交叉验证

机器学习实践：使用sklearn，keras和tensorflow进行机器学习的项目和编码练习

python中sklearn的pipeline模块实例详解

Python 青年羊机器学习 化学化工材料有机化合物预测 线性回归 交叉验证 随机森林 tensorflow keras神经网络

keras学习数据集

Keras 数据增强ImageDataGenerator多输入多输出实例

Keras数据集-CIFAR10

Keras数据集-fashion-mnist

StarForm:StarForm是一个Python库，用于快速开发干净的模块化模型管道。 旨在与sklearn和keras结合使用

keras数据集

keras数据集.zip

keras vgg 代码实例

人工智能课程设计基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别源码+文本检测数据集.zip

Keras-多输入多输出实例(多任务)

2022年全国医院数据（更新至2022年，42000家医院信息）

IEEE39节点数据、包括负荷、节点电压、发电机、线路等

药品说明书数据库医药数据查询excel

最新资源

sklearn-audio-classification：对RAVDESS数据集上的音频分类进行深入分析。使用多种ML技术和MLP进行特征工程，超参数优化，模型评估和交叉验证

Python 青年羊机器学习化学化工材料有机化合物预测线性回归交叉验证随机森林 tensorflow keras神经网络

StarForm:StarForm是一个Python库，用于快速开发干净的模块化模型管道。旨在与sklearn和keras结合使用