AI技术百科
payititi-AI助手
2021-12-10 23:28:46
KNN算法的流程
KNN算法的流程
计算测试数据与各个训练数据之间的距离;按照距离的递增关系进行排序;选取距离最小的K个点;确定前K个点所在类别的出现频率;返回前K个点中出现频率最高的类别作为测试数据的预测分类。下图中给出了KNN算法中K值选区的规则:
图中的数据集是良好的数据,即都有对应的标签。一类是蓝色的正方形,一类是红色的三角形,那个绿色的圆形是待分类的数据。
K= 3 时,范围内红色三角形多,这个待分类点属于红色三角形。K= 5 时,范围内蓝色正方形多,这个待分类点属于蓝色正方形。如何选择一个最佳的K值取决于数据。一般情况下,在分类时较大的 K 值能够减小噪声的影响,但会使类别之间的界限变得模糊。因此 K 的取值一般比较小 ( K < 20 )。