from sklearn.naive_bayes import BernoulliNB
from sklearn.naive_bayes import GaussianNB
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import learning_curve
from sklearn.model_selection import ShuffleSplit
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
mushroom = pd.read_csv("../data/mushrooms.csv")
print(mushroom.head())
print(mushroom.isnull().sum())
print(mushroom['class'].unique())
# 数据预处理
label_encoder = LabelEncoder()
for col in mushroom.columns:
mushroom[col] = label_encoder.fit_transform(mushroom[col])
print(mushroom.head())
# 训练模型
X = mushroom.iloc[:, 1:23]
y = mushroom.iloc[:, 0]
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)
mnb = MultinomialNB()
mnb.fit(X_train, y_train)
print(mnb.score(X_train, y_train))
print(mnb.score(X_test, y_test))
# 查看样本数量对于样本的影响
def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, n_jobs=-1,
train_sizes=np.linspace(.1, 1.0, 5)):
plt.figure()
plt.title(title)
if ylim is not None:
plt.ylim(* ylim)
plt.xlabel('Training examples')
plt.ylabel('Score')
train_sizes, train_scores, test_scores = learning_curve(estimator, X, y, cv=cv,
n_jobs=n_jobs, train_sizes=train_sizes)
train_scores_mean = np.mean(train_scores, axis=1)
test_scores_mean = np.mean(test_scores, axis=1)
plt.grid()
plt.plot(train_sizes, train_scores_mean, 'o-', color='r', label='Training score')
plt.plot(train_sizes, test_scores_mean, 'o-', color='r', label='Cross-validation score')
plt.legend(loc='lower right')
return plt
cv = ShuffleSplit(n_splits=30, test_size=0.3, random_state=28)
estimators = [MultinomialNB(), GaussianNB()]
for estimator in estimators:
title = estimator
plot_learning_curve(estimator, title, X, y, ylim=(0.5, 1.0), cv=cv, n_jobs=-1)
plt.show()
没有合适的资源?快使用搜索试试~ 我知道了~
学习机器学习基础算法总结
共64个文件
py:49个
csv:8个
xml:4个
需积分: 5 0 下载量 186 浏览量
2024-03-02
21:24:13
上传
评论
收藏 38.01MB ZIP 举报
温馨提示
学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结学习机器学习基础算法总结
资源推荐
资源详情
资源评论
收起资源包目录
basic-machine-learning-master.zip (64个子文件)
basic-machine-learning-master
chapter_6
GussianNB_model.py 2KB
naive_bayes_model.py 902B
chapter_4
heart_datasets_model.py 949B
random_forest_model.py 1KB
decision_tree_model.py 2KB
chapter_8
model_3.py 971B
model_1.py 317B
model_2.py 1KB
data
bank.csv 451KB
mushrooms.csv 365KB
fashion-mnist_train.csv 126.88MB
heart.csv 36KB
Admission_Predict.csv 15KB
fashion-mnist_test.csv 21.15MB
abalone.csv 187KB
Mall_Customers.csv 4KB
chapter_3
ridge_regression_model.py 645B
logistic_regression_model.py 544B
linear_regression_model.py 795B
ridge_regression_test_model.py 1KB
lasso_regression_model.py 1KB
linear_svm_model.py 344B
chapter_10
model_3.py 815B
model_7.py 749B
model_5.py 308B
model_1.py 403B
model_2.py 781B
model_4.py 1KB
model_6.py 750B
chapter_7
model_3.py 570B
KNeighor_model.py 868B
model_2.py 1KB
model_4.py 911B
.idea
misc.xml 278B
inspectionProfiles
Project_Default.xml 2KB
profiles_settings.xml 174B
modules.xml 284B
Machine_learning.iml 284B
.gitignore 47B
chapter_12
model_3.py 1KB
model_5.py 1013B
model_1.py 1KB
model_2.py 272B
model_4.py 863B
model_6.py 920B
chapter_5
SVM_model_2.py 1KB
SVM_model_6.py 1KB
SVM_model_3.py 2KB
SVM_model_4.py 1KB
SVM_model_5.py 1KB
SVM_model_1.py 1KB
model
model.pkl 367KB
chapter_1
pandas_test.py 163B
scikit-learn_test.py 133B
scikit-learn_model.py 816B
seborn_test.py 337B
chapter_9
model_3.py 2KB
model_1.py 1KB
model_2.py 689B
chapter_11
model_3.py 392B
model_5.py 612B
model_1.py 460B
model_2.py 460B
model_4.py 727B
共 64 条
- 1
资源评论
小码叔
- 粉丝: 5118
- 资源: 5484
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功