Привет, мне интересно, может ли кто-нибудь помочь мне в чем-то, что меня озадачило.Автоматизация: Извлечь ссылки из xml Меню
Я пытаюсь извлечь все дочерние ссылки из меню на странице:
http://groceries.asda.com/asda-webstore/landing/home.shtml#/cat/1215135760597
Я попытался с помощью селена и поиска XPath, но это, кажется, что связь по самым низким дочерним элементам появляется только когда вы находитесь только на один уровень выше и пройти через каждый вариант, существует более 2000 возможностей. Мне не только понравился способ экономии времени, но и метод, который не позволил бы упустить устаревшее расположение ссылки правой кнопкой мыши и сохранить его в текстовом файле!
Самые низкие дочерние ссылки выглядит следующим образом: http://groceries.asda.com/asda-webstore/landing/home.shtml#/shelf/910001112609/1/so_false
Эта ссылка для Бананы
где есть слово shelf
в них (что является точным описанием того, где я нахожусь в данный момент!). Благодаря!
Не могли бы вы предоставить образец выходного файла. Мало линий будет достаточно. –
Привет, Андрей, я бы хотел, чтобы выходной файл выглядел так: http://groceries.asda.com/asda-webstore/landing/home.shtml?cmpid=ahc--ghs-d1--asdacom-dsk-_ -hp #/полка/1215259254410/1/so_false http://groceries.asda.com/asda-webstore/landing/home.shtml?cmpid=ahc--ghs-d1--asdacom-dsk-_-hp#/полка/910000976333/1/so_false http://groceries.asda.com/asda-webstore/landing/home.shtml?cmpid=ahc--ghs-d1--asdacom-dsk-_-hp#/shelf/ 910000975878/1/so_false http://groceries.asda.com/asda-webstore/landing/home.shtml?cmpid=ahc--ghs-d1--asdacom-dsk-_-hp#/shelf/1215312754908/1/so_false –