в моей студии данных я сейчас пытаюсь извлечь папки URL и их подкаталоги, используя параметры группы в отдельных вычисляемых полях.
Первое вычисленное поле выглядит примерно так:
REGEXP_EXTRACT(Landing Page,'https?:\\/\\/.*?\\/(.*?)\\/.*')
для каждого уровня папки я перемещаю группу на один уровень каталога (и так далее ...):
REGEXP_EXTRACT(Landing Page,"https?:\\/\\/.*?\\/.*?\\/(.*?)\\/.*")
Проблема в том, что каждый URL без косой черты в конце группируется как "null". Я попытался сделать последнюю косую черту необязательной, но это вообще не работает.
REGEXP_EXTRACT(Landing Page,'https?:\\/\\/.*?\\/(.*?)\\/?.*')
REGEXP_EXTRACT(Landing Page, r'https?://[^/]+/[^/]+/([^/]+)')
? См. демонстрацию регулярного выражения - person Wiktor Stribiżew   schedule 16.04.2020