Я пытаюсь скрести некоторые данные из веб-страницы ... мне удалось извлечь имя и цены, но у меня есть проблема здесь ... Фото: http://i.imgur.com/N8p9Fj2.jpgHTML соскабливания XPath
Я хочу напечатать все <li></li>
раздел, но числа, покрытые <bold></bold>
, не отображаются, почему это? Я уверен, что есть способ напечатать все это.
Я делал это: Оригинальный XPath является
//*[@id="ad-54132"]/div[2]/ul/li
Что я укоротить (так, чтобы он не печатает все объявления независимо от того, какой номер они вместо того, чтобы просто напечатав «54132» объявление) в :
squarefeet = tree.xpath('//*/div[2]/ul/li/text()')
И, как я уже сказал в начале, он просто печатает текст, а не на <bold></bold>