PySpark — сохранение таблицы кустов — org.apache.spark.SparkException: не удается распознать строку типа куста

Я сохраняю фрейм данных искры в таблицу кустов. Фрейм данных spark представляет собой вложенную структуру данных json. Я могу сохранить фрейм данных в виде файлов, но он терпит неудачу в тот момент, когда он создает поверх него таблицу кустов, говорящую org.apache.spark.SparkException: Cannot recognize hive type string

Я не могу сначала создать схему таблицы куста, а затем вставить в нее, поскольку фрейм данных состоит из пары сотен вложенных столбцов.

Поэтому я сохраняю его как:

df.write.partitionBy("dt","file_dt").saveAsTable("df")

Я не могу отладить, в чем проблема.


person Gayatri    schedule 10.08.2018    source источник
comment
Я думаю, важно, как продолжается ошибка трассировки: org.apache.spark.SparkException: не удается распознать строку типа куста (...)   -  person Christian Herrera Jiménez    schedule 21.10.2020


Ответы (1)


Проблема, с которой я столкнулся, заключалась в том, что несколько столбцов были названы числами «1», «2», «3». Удаление таких столбцов в кадре данных позволило мне создать таблицу кустов без каких-либо ошибок.

person Gayatri    schedule 13.08.2018
comment
Можете ли вы указать на какую-либо документацию, которая показывает это ограничение? - person Kesty; 05.11.2019