KNN:K最近邻算法,K-Nearest Neighbor是早期的基于统计的有监督分类方法。
举个例子:小明有10个朋友这10个朋友的学习成绩有好有差(“好、中、差”),小明跟这10个朋友的关系也有亲疏;现在已知小明最好的5个朋友中有4个都是成绩好的那么可以推断小明的成绩也是好的。
KNN算法的思想大致就是这么个意思即“近朱者赤,近墨者黑”
一、KNN算法基本步骤
- 计算待分类特征數据到每个训练数据的距离(这里选择Euclidean Distance)
- 对(1)的距离进行升序排序
- 选取(2)排序后排名前K的距离(邻居)对应的训练数据及其类别标签
- K個邻居进行投票,票数最多的类别标签就是待分类特征数据的类别
##检验输入数据是否合规 ##计算所有距离(欧式) ## for循环实现的距离计算 #使用循环数据量较大时存在执行效率低和溢出的问题
发布了39 篇原创文章 · 获赞 4 · 访问量 2万+