# ml_project_seeds
tju机器学习算法与应用大作业——基于预处理的小麦品种的分类和聚类
## 摘要
本项目基于python实现了seeds数据集的预处理与分类、聚类任务,使用了PCA、KPCA、LDA、KLDA四种算法进行数据预处理,使用SVM、逻辑回归、ANN三种方法对预处理与未预处理的数据进行了分类与评估,使用FCM方法对预处理与未预处理的数据进行了聚类与评估,完整地完成了项目的全部要求。实验过程中,对自己实现的预处理算法与sklearn的提供官方算法进行了对比;对比了预处理与否对分类与聚类精度的影响;对所有的算法均实现了可视化;基于pytorch框架使用自行搭建的MLP(多层感知机)神经网络对数据进行分类处理并总结效果。经过本次项目的实践,我对机器学习常用算法的理解与编程能力有了进一步提升,了解了预处理的重要性,也进行了不同机器学习算法应用在同一个问题上的对比,并认识到了各种算法的优劣,在日后解决科研难题的过程中,应当具体问题具体分析,选择最适合解决问题的那种算法。
## 环境配置
- 项目环境基于python3.6构建,为确保不报错,请使用python>=3.6的版本
- 建议使用conda命令进行python环境构建与依赖包的安装
```buildoutcfg
conda create -n ml_test python=3.6
activate ml_test
```
- 所需要的基本依赖包安装命令如下
```buildoutcfg
conda install numpy
conda install scikit-learn
conda install matplotlib
```
- 为运行KLDA,需要使用pip安装mlxtend扩充包
```buildoutcfg
pip install mlxtend
```
- 为运行神经网络,需要安装pytorch,使用cpu版本即可
```buildoutcfg
conda install pytorch
```
## 代码说明
- `1_1_pca_analysis.py` 自己实现的PCA预处理与sklearn实现的PCA预处理效果对比
- `1_2_kpca_analysis.py` 自己实现的KPCA预处理与sklearn实现的KPCA预处理效果对比
- `1_3_lda_analysis.py` 自己实现的LDA预处理与sklearn实现的LDA预处理效果对比
- `1_4_klda_analysis.py` sklearn未实现KLDA,这里只有自己实现的KLDA,部分源码参考[博客链接](https://blog.csdn.net/m0_37692918/article/details/102975453)
- `2_1_1_svm_raw.py` 使用SVM对原始数据直接进行分类,包括不同kernel的选取对比
- `2_1_2_svm_pca.py` 使用SVM对PCA预处理后的数据进行分类,包括不同kernel的选取对比
- `2_1_3_svm_lda.py` 使用SVM对LDA预处理后的数据进行分类,包括不同kernel的选取对比
- `2_2_1_svm_raw.py` 使用逻辑回归对原始数据直接进行分类
- `2_2_2_svm_pca.py` 使用逻辑回归对PCA预处理后的数据进行分类
- `2_2_3_svm_lda.py` 使用逻辑回归对LDA预处理后的数据进行分类
- `2_3_ann.py` 使用MLP(多层感知机)对小麦品种分类
- `3_fcm_analysis.py` 使用FCM对小麦进行聚类并评估
- `dataset.py` 读取小麦数据集的工具包
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 课程设计 基于Python机器学习预处理的小麦品种的分类和聚类源码+详细部署文档+全部数据资料(高分项目).zip课程设计 基于Python机器学习预处理的小麦品种的分类和聚类源码+详细部署文档+全部数据资料(高分项目).zip课程设计 基于Python机器学习预处理的小麦品种的分类和聚类源码+详细部署文档+全部数据资料(高分项目).zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
课程设计 基于Python机器学习预处理的小麦品种的分类和聚类源码+详细部署文档+全部数据资料(高分项目).zip (17个子文件)
ml_project_seeds-main
2_2_1_logregress_raw.py 2KB
seeds_dataset.txt 9KB
2_1_1_svm_raw.py 5KB
1_4_klda_analysis.py 5KB
dataset.py 324B
2_2_3_logregress_lda.py 2KB
2_1_3_svm_lda.py 5KB
2_1_2_svm_pca.py 5KB
1_3_lda_analysis.py 2KB
.gitignore 22B
3_fcm_analysis.py 4KB
1_1_pca_analysis.py 1KB
1_2_kpca_analysis.py 2KB
README.md 3KB
2_3_ann.py 4KB
2_2_2_logregress_pca.py 2KB
171265889347208773632.zip 416B
共 17 条
- 1
资源评论
不走小道
- 粉丝: 3324
- 资源: 5060
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功