算法概述
kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。
最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数
据,对于新的数据则直接和训练数据匹配,如果存在相同属性的训练数据,
则直接用它的分类来作为新数据的分类。这种方式有一个明显的缺点,那就
是很可能无法找到完全匹配的训练记录。
kNN算法则是从训练集中找到和新数据最接近的k条记录,然后根据他们
的主要分类来决定新数据的类别。该算法涉及3个主要因素:训练集、距离
或相似的衡量、k的大小。
行业应用: 客户流失预测、欺诈侦测等(更适合于稀有事件的分类问题)
评论0
最新资源