В настоящее время я использую базу данных временной шкалы с одной таблицей (timestamp, device_id, group_id, data jsonb). Я рассматриваю возможность перехода на influxdb из-за его возможностей масштабирования. Размер данных: около 10 млн строк.
Схема данных:
- Отметка времени (очевидно)
- Идентификатор устройства
- Идентификатор группы
- Данные => от 2 до 30 значений с плавающей запятой
Все записи, сгруппированные по идентификатору группы, располагаются под одним идентификатором устройства. В 99% случаев мне нужно получить все точки данных по идентификатору устройства или идентификатору группы с необязательным ограничением по времени. Не будет необходимости запрашивать одно измерение по заданному периоду. Сохранение - навсегда (удаление только по требованию).
Является ли influxdb хорошим выбором для данных требований? Если да, то как организовать сегменты/теги для такого варианта использования?
Тот факт, что в большинстве случаев мне не нужно запрашивать данные частично и кросс-устройство, вероятно, важен.