Я разделил данные, хранящиеся в S3, в формате улья, подобном этому.
bucket/year=2017/month=3/date=1/filename.json
bucket/year=2017/month=3/date=2/filename1.json
bucket/year=2017/month=3/date=3/filename2.json
Каждый раздел содержит около 1 000 000 записей. Для этого в Афине я создал таблицу и разделы.
Теперь выполняется запрос от Афины
select count(*) from mts_data_1 where year='2017' and month='3' and date='1'
этому запросу требуется 1800 секунд для сканирования 1 000 000 записей.
Итак, мой вопрос: как я могу улучшить производительность этого запроса?