PySpark — сохранение таблицы кустов — org.apache.spark.SparkException: не удается распознать строку типа куста

Я сохраняю фрейм данных искры в таблицу кустов. Фрейм данных spark представляет собой вложенную структуру данных json. Я могу сохранить фрейм данных в виде файлов, но он терпит неудачу в тот момент, когда он создает поверх него таблицу кустов, говорящую org.apache.spark.SparkException: Cannot recognize hive type string

Я не могу сначала создать схему таблицы куста, а затем вставить в нее, поскольку фрейм данных состоит из пары сотен вложенных столбцов.

Поэтому я сохраняю его как:

df.write.partitionBy("dt","file_dt").saveAsTable("df")

Я не могу отладить, в чем проблема.

pyspark databricks apache-spark-2.0

Gayatri 10.08.2018 источник

comment

Я думаю, важно, как продолжается ошибка трассировки: org.apache.spark.SparkException: не удается распознать строку типа куста (...) - Christian Herrera Jiménez 21.10.2020

Ответы (1)

arrow_upward
2
arrow_downward

Проблема, с которой я столкнулся, заключалась в том, что несколько столбцов были названы числами «1», «2», «3». Удаление таких столбцов в кадре данных позволило мне создать таблицу кустов без каких-либо ошибок.

Gayatri 13.08.2018

comment

Можете ли вы указать на какую-либо документацию, которая показывает это ограничение? - Kesty; 05.11.2019

PySpark — сохранение таблицы кустов — org.apache.spark.SparkException: не удается распознать строку типа куста

Ответы (1)

Похожие вопросы