У меня есть набор данных, для которого мне нужно найти K ближайших соседей или всех соседей на расстоянии d. В наборе данных определено произвольное расстояние, но это не евклидово расстояние.
Раньше я использовал деревья показателей, в основном дерево обложек. Однако в этом случае мой набор данных будет больше, чем доступная память. Итак, есть ли какая-либо структура данных, которая может использоваться для ближайших соседей в наборе данных, хранящемся на диске? Также будет полезен хороший индекс базы данных для этой операции.