# -*- coding: utf-8 -*-
"""
Created on Sat Mar 10 09:40:50 2018
@author: Administrator
"""
#绘图
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
#数据预处理
#标准化
#异常值处理
#非线性转换
#二值化
#独热编码(one-hot)
#缺失值插补:支持均值、中位数、众数、特定值插补、多重插补
#衍生变量生成
#模型优化
#不具体列出函数,只说明提供的功能
#特征选择
#随机梯度方法
#交叉验证
#参数调优
#模型评估:支持准确率、召回率、AUC等计算,ROC,损失函数等作图
#导入测试数据
from sklearn import datasets
#数据预处理
from sklearn.preprocessing import Imputer
#用于训练数据和测试数据分类
from sklearn.cross_validation import train_test_split
#导入数据预处理,包括标准化处理或正则处理
from sklearn import preprocessing
#过渡拟合校验
from sklearn.learning_curve import learning_curve
#样本平均测试,评分更加
from sklearn.cross_validation import cross_val_score
#A回归算法
#最小二乘回归(OLS)
from sklearn import linear_model
reg = linear_model.LinearRegression()
#岭回归
from sklearn import linear_model
reg = linear_model.Ridge (alpha = .5)
#逻辑回归算法
from sklearn.linear_model import LogisticRegression
clf_l1_LR = LogisticRegression(C=C, penalty='l1', tol=0.01)
#核岭回归(Kernel ridge regression)
from sklearn.kernel_ridge import KernelRidge
KernelRidge(kernel='rbf', alpha=0.1, gamma=10)
#套索回归(Lasso)
from sklearn import linear_model
reg = linear_model.Lasso(alpha = 0.1)
#弹性网络回归(Elastic Net)
from sklearn.linear_model import ElasticNet
regr = ElasticNet(random_state=0)
#贝叶斯回归(Bayesian Regression)
from sklearn import linear_model
reg = linear_model.BayesianRidge()
#多项式回归(Polynomial regression——多项式基函数回归)
from sklearn.preprocessing import PolynomialFeatures
poly = PolynomialFeatures(degree=2)
poly.fit_transform(X)
#偏最小二乘回归(PLS)
from sklearn.cross_decomposition import PLSCanonical
PLSCanonical(algorithm='nipals', copy=True, max_iter=500, n_components=2,scale=True, tol=1e-06)
#典型相关分析(CCA)
from sklearn.cross_decomposition import CCA
cca = CCA(n_components=2)
#B聚类分析
#KNN算法
from sklearn.neighbors import KNeighborsClassifier
nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
#Kmeans算法
from sklearn.cluster import KMeans
kmeans = KMeans(init='k-means++', n_clusters=n_digits, n_init=10)
#层次聚类(Hierarchical clustering)——支持多种距离
from sklearn.cluster import AgglomerativeClustering
model = AgglomerativeClustering(linkage=linkage,
connectivity=connectivity, n_clusters=n_clusters)
#C降维算法
#主成分方法(PCA)
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
#核函主成分(kernal pca)
from sklearn.decomposition import KernelPCA
kpca = KernelPCA(kernel="rbf", fit_inverse_transform=True, gamma=10)
#因子分析(Factor Analysis)
from sklearn.decomposition import FactorAnalysis
fa = FactorAnalysis()
#D文本挖掘算法
#主题生成模型(Latent Dirichlet Allocation)
#潜在语义分析(latent semantic analysis)
from sklearn.decomposition import NMF, LatentDirichletAllocation
#E分类算法
#线性判别分析(LDA)
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
#二次判别分析(QDA)
from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis
#支持向量机回归(SVR)
from sklearn import svm
clf = svm.SVR()
#导入支持向量算法
from sklearn.svm import SVC
#KNN算法
from sklearn.neighbors import KNeighborsClassifier
nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
#神经网络
from sklearn.neural_network import MLPClassifier
#决策树算法
from sklearn import tree
#贝叶斯算法
from sklearn.naive_bayes import GaussianNB
from sklearn.naive_bayes import MultinomialNB
from sklearn.naive_bayes import BernoulliNB
#F集成算法(Ensemble methods)
#Bagging
from sklearn.ensemble import BaggingClassifier
from sklearn.neighbors import KNeighborsClassifier
bagging = BaggingClassifier(KNeighborsClassifier(),
max_samples=0.5, max_features=0.5)
#随机森林
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_estimators=10)
#AdaBoost
from sklearn.ensemble import AdaBoostClassifier
clf = AdaBoostClassifier(n_estimators=100)
#GBDT(Gradient Tree Boosting)
from sklearn.ensemble import GradientBoostingClassifier
clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0,
max_depth=1, random_state=0).fit(X_train, y_train)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
1.项目代码功能经验证ok,确保稳定可靠运行。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通,帮助解答。 2.主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 3.项目具有丰富的拓展空间,不仅可作为入门进阶,也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip 基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip 基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip 基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip
资源推荐
资源详情
资源评论
收起资源包目录
基于Python机器学习的乳腺癌细胞数据挖掘项目源码+数据.zip (134个子文件)
breast_cancer1.csv 122KB
breast_cancer1.csv 122KB
breast_cancer.csv 120KB
breast_cancer.csv 120KB
cancertree.dot 3KB
cancertree.dot 3KB
mytree.dot 590B
mytree.dot 590B
项目说明.md 95B
项目说明.md 95B
1.PNG 600KB
1.PNG 600KB
sklearn_functions.py 5KB
sklearn_functions.py 5KB
factor_analysis.py 5KB
factor_analysis.py 5KB
factor_analysis1.py 5KB
factor_analysis1.py 5KB
step2_automate_find_informative_variables.py 4KB
step2_automate_find_informative_variables.py 4KB
factor_analysis5.py 3KB
factor_analysis5.py 3KB
step4_correct.py 3KB
step4_correct.py 3KB
factor_analysis4.py 3KB
factor_analysis4.py 3KB
decisionTree_variableFiltered.py 3KB
decisionTree_variableFiltered.py 3KB
step5_statistics_score_rule.py 3KB
step5_statistics_score_rule.py 3KB
step3_zero_to_1.py 2KB
step3_zero_to_1.py 2KB
svm.py 2KB
svm.py 2KB
xgboost1.py 2KB
xgboost1.py 2KB
neuron_network.py 2KB
neuron_network.py 2KB
naive_bayes.py 2KB
naive_bayes.py 2KB
preprocessing.py 2KB
preprocessing.py 2KB
factor_analysis2.py 2KB
factor_analysis2.py 2KB
randomForest_variableFilter.py 2KB
randomForest_variableFilter.py 2KB
decisionTree_crossValidation.py 1KB
decisionTree_crossValidation.py 1KB
factor_analysis33.py 1KB
factor_analysis33.py 1KB
ridge_regression.py 1KB
ridge_regression.py 1KB
factor_analysis3.py 1KB
factor_analysis3.py 1KB
randomForest.py 1KB
randomForest.py 1KB
logistic_variableFiltered.py 1KB
logistic_variableFiltered.py 1KB
step1_customers_split_goodOrBad.py 663B
step1_customers_split_goodOrBad.py 663B
breast_cancer_总.xlsx 181KB
breast_cancer_总.xlsx 181KB
result_good.xlsx 75KB
result_good.xlsx 75KB
breast_cancer_变量筛选.xlsx 60KB
breast_cancer_变量筛选.xlsx 60KB
breast_cancer_变量筛选.xlsx 60KB
breast_cancer_变量筛选.xlsx 60KB
breast_cancer_变量筛选.xlsx 60KB
breast_cancer_变量筛选.xlsx 60KB
result_bad.xlsx 46KB
result_bad.xlsx 46KB
worst concave points.xlsx 21KB
worst concave points.xlsx 21KB
ID.xlsx 18KB
ID.xlsx 18KB
smoothness error.xlsx 17KB
smoothness error.xlsx 17KB
fractal dimension error.xlsx 17KB
fractal dimension error.xlsx 17KB
compactness error.xlsx 17KB
compactness error.xlsx 17KB
mean compactness.xlsx 17KB
mean compactness.xlsx 17KB
texture error.xlsx 17KB
texture error.xlsx 17KB
worst concavity.xlsx 17KB
worst concavity.xlsx 17KB
concavity error.xlsx 17KB
concavity error.xlsx 17KB
radius error.xlsx 17KB
radius error.xlsx 17KB
worst area.xlsx 17KB
worst area.xlsx 17KB
mean area.xlsx 17KB
mean area.xlsx 17KB
area error.xlsx 17KB
area error.xlsx 17KB
mean concave points.xlsx 17KB
mean concave points.xlsx 17KB
共 134 条
- 1
- 2
资源评论
z同学的编程之路
- 粉丝: 1803
- 资源: 2129
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功