K-近邻算法
作者:互联网
算法思想:首先计算预测的点与所有的点的距离,然后从小到大排序取前K个最小的距离对应的点,统计前K个点对应的label的个数,取个数最大的label作为预测值
K邻居分类器:简单地在训练数据中找到与测试样本“最相似”(特征空间中的“邻居”)的样本,然后为测试样本赋予与“最相似”的相同标签训练样本。
使用曼哈顿距离(L1)来衡量图片的相似性。
采用CIFAR10,效果如下
效果并不是很好。
K-近邻分类器在图片上的局限性:
①测试时非常慢
②像素的距离度量没有信息量
③维度限制
第三点如何理解
总结:在图像分类中,首相要设置一组图像和标签的训练集,并且必须在测试集预测上
K-近邻 分类器根据最近的训练示例预测标签
距离度量和 K 是超参数
使用验证集选择超参数; 最后只在测试集上运行一次
标签:标签,近邻,样本,距离,分类器,算法,测试 来源: https://blog.csdn.net/ckq707718837/article/details/121699228