Лучшая структура данных для хранения координат для эффективного поиска?

Кажется, здесь есть похожий вопрос , но я не был удовлетворен ни ясность ответа, ни его практичность. В недавнем интервью меня спросили, в какой структуре данных я буду хранить свой большой набор чисел с плавающей запятой, чтобы искать новое поступление для себя или своего ближайшего соседа. Я сказал, что буду использовать бинарное дерево поиска и попытаюсь сделать его сбалансированным для достижения O(log n).

Затем вопрос был расширен до двух измерений: какую структуру данных я буду использовать для хранения большого набора пар (x, y), таких как географические координаты, для быстрого поиска? Я не мог придумать удовлетворительного ответа и полностью сдался, когда его расширили до K-измерений. Непосредственное использование k-мерного дерева, которое использует значения координат для «разделения» пространства, похоже, не работает, поскольку две близкие точки вблизи начала координат, но внутри разных квадрантов могут оказаться на очень далеких листьях.

После интервью я вспомнил о диаграммах Вороного для красивого разбиения K-мерного пространства. Каков наилучший способ реализации этого с использованием какой структуры данных? Как будут выполняться поиски? Я чувствую, что этот вопрос настолько распространен в компьютерных науках, что к настоящему времени у него даже есть специальная структура данных.

voronoi space-partitioning

user3133942 25.02.2014 источник

comment

Для плавающей запятой я бы начал с двоичного дерева поиска. Если бы это было узким местом, я бы переключился на хэширование целочисленной части (или что-то в этом роде). Для географических координат у меня, вероятно, была бы сетка векторов координат или (опять же) хеш векторов похожих координат. - Mooing Duck 26.02.2014

Ответы (1)

arrow_upward
0
arrow_downward

Вы можете использовать сетку и сортировать точки по ячейкам сетки. Здесь есть аналогичный вопрос: Расчет расстояния для огромного количества устройств/узлов. . Вы также можете использовать кривую заполнения пространства (quadkey) или quadtree, например. r-tree, когда вам нужна дополнительная информация, например, иерархия.

Gigamegs 02.03.2014

Лучшая структура данных для хранения координат для эффективного поиска?

Ответы (1)

Похожие вопросы