Я создаю таблицы в улье для базы пространственных данных, я знаю, что есть специальные индексы для пространственных данных, которые представляют собой R-дерево. В улье создать пространственный индекс невозможно (я думаю). Я думал о попытке сделать индекс x, y (long, lat), непрерывных переменных с десятичными знаками. Не думаю, что это самое эффективное.
Мы используем библиотеки esri для пространственной алгебры, но в некоторых случаях производительность запросов очень низкая.
Инструменты Esri gis для Hadoop
Я подумал ....
Что лучше: создать индекс для этих двух переменных или разбить таблицу по переменной типа xi = int(x/0.2) * 0.2, yi = int(y/0.2) * 0.2?
Я думаю, что раздел таблицы более эффективен, но дизайн более сложных запросов, также я думаю, что раздел не поддерживает числовые переменные с десятичными знаками.
Наиболее типичными запросами с ограничивающей рамкой будут диапазоны пространственных данных. Кто-нибудь знает эффективный способ структурировать данные с помощью улья для таких запросов?
Есть ли способ создать и внедрить R-дерево в улей? Можете ли вы разделить таблицу с непрерывными значениями с десятичными знаками (я видел много примеров и, кажется, нет)?