# k-近邻算法
## 一般流程
1. 收集数据
2. 准备数据
3. 分析数据
4. 训练算法
5. 测试算法
6. 使用算法
## 分析数据的具体过程
对未知类别属性的数据集中的每个点一次执行如下操作:
1. 计算已知类别的数据集中的点与当前点之间的距离
2. 按照距离递增的次序排序
3. 选取与当前点距离最小的k个点
4. 确定前k个点所在类别的出现频率
5. 返回前k个点出现频率最高的类别作为当前点的预测分类
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
机器学习(ML)是计算机系统为了有效地执行特定任务,不使用明确的指令,而依赖模式和推理使用的算法和统计模型的科学研究。它被视为人工智能的一个子集。机器学习算法构建一个基于样本数据的数学模型,称为“训练数据”,以便在没有明确编程来执行任务的情况下进行预测或决策。[1][2]机器学习算法用于各种应用,例如电子邮件过滤和计算机视觉,在这些应用中,开发用于执行任务的特定指令的算法是不可行的。机器学习与计算统计学密切相关,计算统计学侧重于使用计算机进行预测。算法优化的研究为机器学习领域提供了方法、理论和应用领域。数据挖掘是机器学习中的一个研究领域,侧重于探索性数据分析到无监督学习。[3][4]在跨业务问题的应用中,机器学习也被称为预测分析。
资源推荐
资源详情
资源评论
收起资源包目录
《机器学习实战》.zip (5个子文件)
content
LICENSE 1KB
kNN
kNN.py 1KB
README.md 516B
.gitignore 702B
README.md 44B
共 5 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3825
- 资源: 5235
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功