Я загружаю кадры данных Spark в H2O (используя Python) для построения моделей машинного обучения. Мне было рекомендовано выделить кластер H2O с оперативной памятью в 2-4 раза больше, чем кадр, на котором я буду тренироваться, чтобы анализ удобно помещался в памяти. Но я не знаю, как точно оценить размер кадра H2O.
Итак, предположим, что у меня есть фрейм H2O, уже загруженный в Python, как мне определить его размер в байтах? Приближение в пределах 10-20% нормально.