Я пытаюсь собрать тексты и изображения с веб-сайта, чтобы помочь собрать пропавшие без вести твиты. Вот проблема:Selenium найдет все элементы, которые имеют два divs
В некоторых твитах нет изображений, поэтому соответствующий <div class='c' ....>
имеет только один <div>...</div>
. Некоторые твиты имеют изображения, поэтому соответствующие <div class='c' ....>
имеет два <div>...</div>
, как показано в следующих кодов:
<div class='c' id="M_D*****">
<div>...</div>
и
<div class='c' id="M_D*****">
<div>...</div>
<div>...</div>
Я намерен проверить, имеет ли твит изображение, то есть выяснить, имеет ли соответствующий <div class='c' ....>
два <div>...</div>
.
PS: Следующие коды используются для сбора всех текстов и URL-адресов изображений, но не у всех твитов есть изображения, поэтому я хочу их сопоставить, решая вышеуказанную проблему.
tweets = browser.find_elements_by_xpath("//span[@class='ctt']")
graph_links = browser.find_elements_by_xpath("//img[@alt='img' and @class='ib']")
Это общественная программа социального обеспечения, цель которой - помочь пропавшим людям вернуться домой.
Если это общедоступный сайт, можете ли вы поделиться страницей с нами? – JeffC