Google Classroom谷歌课堂
GeoGebraGeoGebra 教室

一、算法概述

KNN 算法的原理就是当预测一个新值 x 属于哪个类别时,根据它距离最近的 K 个点的类别属性的占比大小来进行简单分类。从这个意义上讲,K 值的选取是本算法的关键,不同的 K 值会带来类别属性占比大小的变化,从而影响 x 的分类判别。以图 2-4-1所示的图形进行说明。

图 2-4-1 KNN 算法原理图示 图 2-4-1 中圆点和叉点分别代表两个类,菱形点是被分类点,如果取 ,则其近邻共3 个点,2 叉点 1 圆点,所以被归类为叉类;如果取,则其近邻共 5 个点,3 圆点 2 叉点,则其又被归类为圆类。时的动态图显示如下:
由此,可以归纳出 KNN 算法流程,如图 2-4-2 所示。
          [size=100]                            图 2-4-2 KNN 算法流程[/size]
图 2-4-2 KNN 算法流程