При использовании Pig для ETL я помещаю обработанные данные в Hive с помощью HCatStorer:
STORE dataprocessed INTO 'database.table' USING org.apache.hcatalog.pig.HCatStorer();
Моя цель - сделать данные целевой таблицы пригодными для использования либо из Pig, либо из Hive (в зависимости от навыков пользователя).
Каков рекомендуемый формат для хранения даты и времени?
я забочусь о:
- Хранение информации о часовом поясе
- Возможность сравнивать даты
- Быть удобочитаемым для человека (например, я не верю, что временная метка удобочитаема для человека)
Спасибо за помощь