Я пытаюсь извлечь только имя файла из ссылки javascript в import.io, например, googlebolver.htm
из href="javascript:finpopup('googlebolver.htm',920,620,0)"
Мне удалось перейти по «ссылке» (javascript:finpopup('googlebolver.htm',920,620,0)
) со следующим XPath
//*[text()='GOOGLE.MAPS']/@href
но я хотел бы добраться до фактического адреса самостоятельно. Поскольку я использую import.io Extracto для нескольких URL-адресов, я хочу, чтобы он нашел что-то вроде *.htm
Я считаю, что это возможно с помощью функции подстроки, но я не знаю, как это сделать. Следующие вопросы этого сайта выглядели многообещающе, но один работает только для укусов фиксированной длины, а другой я не совсем понимаю и работает только для определенного «слова».
- Извлеките значение из объекта javascript на сайте, используя xpath и import.io
- Как использовать substring() с Import.io?
Заранее спасибо за вашу помощь
РЕДАКТИРОВАТЬ: Вот URL