/ *日期:2018年5月7日作者:Raj Mehrotra * /
来自kaggle的“红酒质量”数据集。
数据集包含有关葡萄酒样品的详细信息,以及说明葡萄酒中不同化学物质浓度的不同特征。 目标变量是0-10的葡萄酒质量。
我首先探索并分析了数据,并使用了熊猫,matplotlib,seaborn库进行了可视化,并研究了不同类别和数字特征的分布。 然后,我清理了数据并准备好进行建模。然后,我还使用sklearn提供的StandardScaler缩放了所有数字功能以实现更好的性能。
最后,我从scikit学习中使用了不同的ML算法,包括SVM,RandomForest等。 我还使用GridSearchCV函数调整了所有算法的参数。
最后,通过使用带有“ rbf”内核和参数“ C”和“ gamma”的调整值的支持向量机,我在数据集上的精度为0.9175。