Я довольно новичок в Scrapy, поэтому, пожалуйста, медведь со мной на мгновение.не может найти правильный xpath под оболочкой
Я хочу, чтобы очистить this page следующей информацию
- проект аббревиатуры (PROTECTRAIL)
- проекта Краткого описание (Железнодорожная-Индустрия партнерство по комплексной безопасности железнодорожного транспорта)
- проекта длинного описания (Перед лицом проблемы улучшения [...] зданий и инфраструктуры)
Использование Google Скребок У меня есть возможность ред эти элементы и определили их Xpath на странице HTML
- акроним:
//*[@id='recorddetails']/div/div[1]/h1
- Краткое описание:
//*[@id='recorddetails']/div/div[1]/h2
- длинное описание:
//*[@id='recorddetails']/div/div[4]/div[2]/div[1]/p/text()
Я затем протестировали следующие Xpath запросы при SHELL
- акроним:
sel.xpath("//*[@id='recorddetails']/div/div[1]/h1").extract()
- Краткое описание:
sel.xpath("//*[@id='recorddetails']/div/div[1]/h2")
- длинное описание:
sel.xpath("//*[@id='recorddetails']/div/div[4]/div[2]/div[1]/p/text()").extract()
Но оболочка дает никакого результата [] для этих различных запросов XPath, в то время как они, кажется, не правильно написано (не ошибка синтаксиса) и достаточно точным.
Как я могу узнать правильный селектор с соответствующим Xpath, чтобы получить эту информацию?
Спасибо за помощь! Но как мне перейти от исходного URL-адреса к одному вызову AJAX? – user3301871
у вас установлен firebug? его расширение Firefox, лучше, чем хром IMO, как сказано в ответе, когда он открыт, перейдите на вкладку Net и отфильтруйте XHR, вы увидите там звонок –
, мне просто пришлось перезагрузить страницу, чтобы см., где идет вызов AJAX. Наверное, я заменил весь исходный URL-адрес этими, прежде чем кормить их пауком. Спасибо за вашу помощь! – user3301871