代码手动实现了决策树的ID3,C4.5以及分类CART和决策CART树,并且实现了预剪枝和后剪枝。
相关参数介绍如下:
DecisionTree类:功能实现类。
:param prePruning[是否预剪枝]: bool ---> true or false
:param postPruning[是否后剪枝]: bool ---> true or false
:param algorithm[采用何种算法]: 'ID3',‘C4.5’,'ClassCART','RegressorCART'
:param islog[是否打印详细日志] : log detail
:param RegressorStopLoss[CART回归树停止迭代的阈值]: for CARTRegressor to stop iteration
BaseUtils:基础工具实现类,包含了数据集的读取
main:主函数入口
数据集介绍如下:
给出四个属性特征,年龄,工作,是否有房子以及信贷情况来决定是否给予贷款。
![Image text](https://raw.githubusercontent.com/FindTheTruth/Machine-learning/main/DecisionTree/png/1.png)
对数据集进行维度信息编码如下:
1.年龄:0表示青年,1表示中年,2表示老年;
2.有工作:0表示无,1表示有
3.是否有房子: 0表示无,1表示有
4.信贷情况:0表示一般,1表示好,2表示非常好
贷款结果:
贷款结果:0表示不给与贷款,1表示给予贷款。
没有合适的资源?快使用搜索试试~ 我知道了~
聚焦手动实现基础机器学习算法.zip
共40个文件
py:12个
md:8个
txt:5个
需积分: 5 0 下载量 137 浏览量
2024-04-16
22:51:40
上传
评论
收藏 8.43MB ZIP 举报
温馨提示
众所周知,人工智能是当前最热门的话题之一, 计算机技术与互联网技术的快速发展更是将对人工智能的研究推向一个新的高潮。 人工智能是研究模拟和扩展人类智能的理论与方法及其应用的一门新兴技术科学。 作为人工智能核心研究领域之一的机器学习, 其研究动机是为了使计算机系统具有人的学习能力以实现人工智能。 那么, 什么是机器学习呢? 机器学习 (Machine Learning) 是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。 机器学习的用途 机器学习是一种通用的数据处理技术,其包含了大量的学习算法。不同的学习算法在不同的行业及应用中能够表现出不同的性能和优势。目前,机器学习已成功地应用于下列领域: 互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域----证券市场分析、信用卡欺诈检测等 医学领域----疾病鉴别/诊断、流行病爆发预测等 刑侦领域----潜在犯罪识别与预测、模拟人工智能侦探等 新闻领域----新闻推荐系统等 游戏领域----游戏战略规划等 从上述所列举的应用可知,机器学习正在成为各行各业都会经常使用到的分析工具,尤其是在各领域数据量爆炸的今天,各行业都希望通过数据处理与分析手段,得到数据中有价值的信息,以便明确客户的需求和指引企业的发展。
资源推荐
资源详情
资源评论
收起资源包目录
聚焦手动实现基础机器学习算法.zip (40个子文件)
content
DecisionTree
main.py 858B
png
1.png 60KB
readme.md 1KB
Dataset
dataset.txt 160B
testset.txt 69B
BaseUtils.py 826B
DecisionTree.py 15KB
clusters algorithm
picture
tiger.png 1.61MB
main.py 4KB
GenerateDir
newtiger_gm32.png 273KB
newtiger_k32.png 274KB
README.md 364B
Face Recognition
main.py 8KB
BMPReader.py 3KB
README.md 578B
Data
CASIA-FaceV5.txt 180B
Bayesian
main.py 5KB
README.md 170B
Data
simhei.ttf 9.58MB
spam_5000.utf8 1.24MB
stopword.txt 9KB
shape.png 12KB
ham_5000.utf8 2.36MB
LICENSE 11KB
SVM
svm_model.py 9KB
main.py 1KB
README.md 176B
wifiStrength
main.py 5KB
readme.md 190B
.idea
misc.xml 185B
inspectionProfiles
Project_Default.xml 444B
profiles_settings.xml 174B
modules.xml 276B
wifiStrength.iml 284B
.gitignore 47B
Data
Unbalance_wifi_localization.txt 25KB
LP Model
readme.md 86B
LPM.py 673B
LPMModel.py 3KB
README.md 567B
共 40 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3798
- 资源: 4426
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功