У меня есть Spark SQL DataDrame
с широтой и долготой столбцов, я пытаюсь фильтровать строки, которые опускаются ниже порогового значения, вычисляя расстояние до входа. Мой текущий код выглядит так. Я использую geopy
(great_circle
) для вычисления расстояния между парами широта и долгота.
from geopy.distance import great_circle
point = (10, 20)
threshold = 10
filtered_df = df.filter(great_circle(point, (df.lat, df.lon)) < threshold)
Когда я запускаю этот код, я получаю следующую ошибку
ValueError: Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame boolean expressions.
Я не понимаю, какая часть выражения фильтра неверна.