机器学习代码实战机器学习代码实战——One-Hot编码(独热编码)编码(独热编码)
文章目录文章目录1.实验目的2.训练+预测2.1.get_dummies方法2.2.OneHotEncoder方法
1.实验目的实验目的
根据csv文件已给属性(Car Model、Mileage、Sell Price($)、Age(yrs))来预测汽车售价。下面将给出两种预测onehot编码方
法,其中模型用LinearRegression。
汽车数据
密码:7izi
2.训练训练+预测预测
2.1.get_dummies方法方法
import pandas as pd
df = pd.read_csv('carprices.csv')
dummies = pd.get_dummies(df['Car Model']) #对Car Model字段用get_dummies数字化
dummies
merged = pd.concat([df,dummies],axis='columns') #合并字段
final = merged.drop(['Car Model','Mercedez Benz C class'],axis='columns') #删除原Car Model字段和Mercedez Benz C class,其中删除Mercedez Benz C
class是为了防止虚拟陷阱(详细请查阅相关资料)
X = final.drop('Sell Price($)',axis='columns') #训练数据
y = final['Sell Price($)'] #训练标签
from sklearn.linear_model import LinearRegression
model = LinearRegression()
评论0
最新资源