Я пытаюсь извлечь только имя файла из яваскрипта ссылки в import.io, например googlebolver.htm
от href="javascript:finpopup('googlebolver.htm',920,620,0)"
XPath - Извлечение spectific имени файла из строки
мне удалось добраться до «ссылки» (javascript:finpopup('googlebolver.htm',920,620,0)
) со следующим XPath
//*[text()='GOOGLE.MAPS']/@href
, но я хотел был бы получить к фактическому адресу самостоятельно. Как я использую import.io Extracto на нескольких URL-адресах, я хочу найти что-то вроде *.htm
Я считаю, что это возможно возможно с помощью функции подстроки, но я не знаю, как это сделать. следующие вопросы этого сайта выглядели многообещающими, но один работает только для укусы фиксированной длины, а другой я не совсем понимаю, и работает только для конкретного «слова»
- Extract value from javascript object in site using xpath and import.io
- How to use substring() with Import.io?
заранее спасибо за вашу помощь
EDIT: Вот URL
Можете ли вы поделиться своим URL-адресом –
@AndrewFogg Выполнено :-) Я использую поиск XPath вместо местоположения, потому что некоторые другие страницы помещают его в другом порядке – adamantium