В настоящее время у меня есть фрейм данных pyspark, из которого я изначально создал дельта-таблицу, используя приведенный ниже код -
df.write.format("delta").saveAsTable("events")
Теперь, поскольку приведенный выше фрейм данных заполняет данные ежедневно по моему требованию, следовательно, для добавления новых записей в дельта-таблицу я использовал синтаксис ниже -
df.write.format("delta").mode("append").saveAsTable("events")
Теперь все это я сделал в блоках данных и в своем кластере. Я хочу знать, как я могу написать общий код pyspark на python, который будет создавать дельта-таблицу, если она не существует, и добавлять записи, если дельта-таблица существует. Я хочу это сделать, потому что, если я передам кому-то свой пакет python, они не будут имеют одинаковую дельта-таблицу в своей среде, поэтому она должна создаваться динамически из кода.