У меня есть кадр данных, который я получил, выполнив запрос с использованием SQLContext:
> df <- sql(sqlContext, "SELECT * FROM myTable")
когда я пытаюсь получить его размер
> object.size(df)
1024 bytes
Я знаю, что это не реальный размер кадра данных, вероятно, потому, что он распределен по узлам Spark. Чтобы получить реальный размер, мне нужно собрать его:
> localDf <- collect(df)
> object.size(localDf)
45992 bytes
Иногда фрейм данных слишком велик, чтобы поместиться в локальной памяти. Есть ли простой способ узнать фактический размер кадра данных, не принося его локально?