没有合适的资源?快使用搜索试试~ 我知道了~
python使用pandas抽样训练数据中某个类别实例
3 下载量 145 浏览量
2020-12-20
15:12:33
上传
评论
收藏 40KB PDF 举报
温馨提示
试读
1页
废话真的一句也不想多说,直接看代码吧! # -*- coding: utf-8 -*- import numpy from sklearn import metrics from sklearn.svm import LinearSVC from sklearn.naive_bayes import MultinomialNB from sklearn import linear_model from sklearn.datasets import load_iris from sklearn.cross_validation import train_test_split from sk
资源推荐
资源详情
资源评论
python使用使用pandas抽样训练数据中某个类别实例抽样训练数据中某个类别实例
废话真的一句也不想多说,直接看代码吧!
# -*- coding: utf-8 -*-
import numpy
from sklearn import metrics
from sklearn.svm import LinearSVC
from sklearn.naive_bayes import MultinomialNB
from sklearn import linear_model
from sklearn.datasets import load_iris
from sklearn.cross_validation import train_test_split
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn import cross_validation
from sklearn import preprocessing
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
def test():
df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
"positionType","age","gender","education","marriageStatus",
"haveBaby","hometown","residence","appCategory","label"]] print df1["label"].value_counts()
N_data = df1[df1["label"]==0] P_data = df1[df1["label"]==1] N_data = N_data.sample(n=P_data.shape[0], frac=None,
replace=False, weights=None, random_state=2, axis=0)
#print df1.loc[:,"label"]==0
print P_data.shape
print N_data.shape
data = pd.concat([N_data,P_data])
print data.shape
data = data.sample(frac=1).reset_index(drop=True)
print data[["label"]] return
补充拓展:补充拓展:pandas实现对实现对dataframe抽样抽样
随机抽样随机抽样
import pandas as pd
#对dataframe随机抽取2000个样本
pd.sample(df, n=2000)
分层抽样分层抽样
利用利用sklean中的函数灵活进行抽样中的函数灵活进行抽样
from sklearn.model_selection import train_test_split
#y是在X中的某一个属性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)
以上这篇python使用pandas抽样训练数据中某个类别实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希
望大家多多支持软件开发网。
您可能感兴趣的文章您可能感兴趣的文章:python 子类调用父类的构造函数实例Python实现子类调用父类的初始化实例Python类的绑定方法和非绑
定方法实例解析python GUI库图形界面开发之PyQt5访问系统剪切板QClipboard类详细使用方法与实例python编程进阶之类和
对象用法实例分析Python读取表格类型文件代码实例python定义类self用法实例解析Python类和实例的属性机制原理详解
资源评论
weixin_38572115
- 粉丝: 6
- 资源: 946
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功