Я отсортировал последовательность данных целых чисел. Максимальная разница между двумя числами равна 3. Таким образом, данные выглядят, например, так:
Data: 1 2 3 5 7 8 9 10 13 14
Differences: (start 1) 1 1 2 2 1 1 1 3 1
Есть ли лучший способ сохранить (сжать) этот тип последовательностей, чем сохранить значения разницы? Потому что, если я использую методы на основе словаря, мне не удалось сжать из-за случайности чисел 1,2 и 3. Если я использую сжатие в стиле «PAQ», результат лучше, но все же не совсем удовлетворительный. Хаффман и арифметический кодер хуже, чем методы на основе словаря.
Есть ли способ с предсказанием?
Например, чтобы использовать регрессию для исходных данных и сохранять различия (которые могут быть меньше или более последовательными).
Или использовать какой-то прогноз, основанный на гистограмме различий?
Или что-то совершенно другое... или это вообще невозможно (что, на мой взгляд, является реальным ответом :))