#### Machine Learning classification algorithm demo
#### 机器学习分类算法demo
金融客户分类,类举几种常用分类算法的基本使用,各种分类方法模型最终需要参考的不只是准确率 ,还包括召回率,F1分数等
#### Environment
* python 3.7.2
* sklearn 0.23.2
* pandas 1.1.5
* numpy 1.19.4
#### Code
##### 聚类
`k_means.py` -- K均值聚类 -- 0.85
`svm.py` -- 支持向量机聚类
`gmm.py` -- 高斯混合模型聚类 -- 0.70
`DBSCAN.py` -- DBSCAN密度聚类 -- 0.40
##### 其他分类
`KNN.py` -- K近邻 -- 0.89
`logistic.py` -- 逻辑回归 -- 0.90 ± 1
`decision_tree.py` -- 决策树 -- 0.90 ± 1
`naive_bayes.py` -- 朴素贝叶斯 -- 0.86
#### File
`bank-full.csv` - 数据文件
`bank-names.txt` - 数据字段含义
`tree.dot` - 决策树结构
`tree.png` - 决策树效果图
#### Process
* 导入文件观察数据情况 总数据 45000
* 本案例中unknown值较多 直接dropna只剩下 7800
因此选择填充,当前采用频率最高词填充
一些字段自己可用均值填充请自行完成
* 相关参数为分类例如本案例中的职业Job
可转化为数字编码代表其含义 同时方便训练
* 有必要的话对数据进行过采样或欠采样之类的处理
* 根据数据情况选择合适的特征工程
* 使用模型训练
* 分析结果
#### Remark
* 随便一个都可以分类,所用算法可自行学习,若想深入可自己学习
* 决策树配合随机森林训练时间很长
决策树可生成dot文件
使用Graphivz生成图片
* svm训练时间很长
* 目前碍于个人能力原因,效果最差的是DBSCAN!!!
* 仅供学习交流,严禁用于商业用途,请于24小时内删除
没有合适的资源?快使用搜索试试~ 我知道了~
Machine learning classification algorithm demo 机器学习分类算法demo.zip
共14个文件
py:8个
csv:1个
txt:1个
需积分: 5 0 下载量 21 浏览量
2024-04-16
22:23:02
上传
评论
收藏 1.09MB ZIP 举报
温馨提示
众所周知,人工智能是当前最热门的话题之一, 计算机技术与互联网技术的快速发展更是将对人工智能的研究推向一个新的高潮。 人工智能是研究模拟和扩展人类智能的理论与方法及其应用的一门新兴技术科学。 作为人工智能核心研究领域之一的机器学习, 其研究动机是为了使计算机系统具有人的学习能力以实现人工智能。 那么, 什么是机器学习呢? 机器学习 (Machine Learning) 是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。 机器学习的用途 机器学习是一种通用的数据处理技术,其包含了大量的学习算法。不同的学习算法在不同的行业及应用中能够表现出不同的性能和优势。目前,机器学习已成功地应用于下列领域: 互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域----证券市场分析、信用卡欺诈检测等 医学领域----疾病鉴别/诊断、流行病爆发预测等 刑侦领域----潜在犯罪识别与预测、模拟人工智能侦探等 新闻领域----新闻推荐系统等 游戏领域----游戏战略规划等 从上述所列举的应用可知,机器学习正在成为各行各业都会经常使用到的分析工具,尤其是在各领域数据量爆炸的今天,各行业都希望通过数据处理与分析手段,得到数据中有价值的信息,以便明确客户的需求和指引企业的发展。
资源推荐
资源详情
资源评论
收起资源包目录
Machine learning classification algorithm demo 机器学习分类算法demo.zip (14个子文件)
content
tree.png 689KB
DBSCAN.py 2KB
svm.py 2KB
decision_tree.py 4KB
logistic.py 5KB
k_means.py 2KB
tree.dot 25KB
bank-full.csv 4.4MB
KNN.py 2KB
.gitignore 2KB
naive_bayes.py 2KB
bank-names.txt 2KB
README.md 2KB
gmm.py 2KB
共 14 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3599
- 资源: 2900
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功