У меня есть такой файл журнала. Я хочу создать DataFrame в Scala.
2015-05-13T23:39:43.945958Z my-loadbalancer 192.168.131.39:2817 10.0.0.1:80 0.000086 0.001048 0.001337 200 200 0 57 "GET https://www.example.com:443/ HTTP/1.1" "curl/7.38.0" DHE-RSA-AES128-SHA TLSv1.2
Я хочу заменить все пробелы запятыми, чтобы использовать spark.sql, но не могу этого сделать.
Вот все, что я пробовал:
- Сначала попытался импортировать его как текстовый файл, чтобы увидеть, есть ли метод replaceAll.
- Пробовал разбивать по пространству.
Какие-либо предложения. Я просмотрел документацию, и там нет упоминания о функции замены, как в Pandas.