(Я не знаю, как форматировать математические формулы. Для получения более подробной информации и четких представлений см. это.)
Я хотел бы предложить противоположную точку зрения, что KNN является своего рода упрощенным наивным байесовским методом (NB), рассматривая KNN как среднее значение оценки плотности.
Чтобы выполнить оценку плотности, мы пытаемся оценить p(x) = k/NV, где k — количество выборок, лежащих в области R, N — общее количество выборок, а V — объем области R. Обычно есть два способа его оценки: (1) зафиксировав V, рассчитать k, что известно как оценка плотности ядра или окно Парзена; (2) зафиксировав k, рассчитать V, который является оценкой плотности на основе KNN. Последний из-за множества недостатков менее известен, чем первый.
Тем не менее, мы можем использовать оценку плотности на основе KNN для соединения KNN и NB. Учитывая общее количество N выборок, Ni выборок для класса ci, мы можем записать NB в форме оценки плотности на основе KNN, рассматривая область, содержащую x:
P(ci|x) = P(x|ci)P(ci)/P(x) = (ki/NiV)(Ni/N)/(k/NV) = ki/k,
где ki — номер выборки класса ci, лежащий в области. Окончательная форма ki/k на самом деле является классификатором KNN.
person
oNgStrIng
schedule
02.07.2019