Я новичок в Python, и в настоящее время я работаю над решением проблем, чтобы улучшить свои навыки кодирования. Я отправил форму с использованием python и со следующей страницы, отображаемой после отправки формы, я хочу собрать некоторые данные и отобразить их в моем выпуске. Необходимые данные, которые я хочу собрать, находятся между <TR> </TR>
тегами и есть много <TR> </TR>
как на этой странице.Parsing <TR></TR> теги и печать элементов с помощью BeautifulSoup в Python
для справки:
<TR class="even"><TD class="id">6422275</TD><TD class="date"><NOBR>09:06:49</NOBR><BR><NOBR>27 Feb 2016</NOBR></TD><TD class="coder"><A HREF="author.aspx?id=201837">THE_ROCK</A></TD><TD class="problem"><A HREF="problem.aspx?space=1&num=1000">1000<SPAN CLASS="problemname">. A+B Problem</SPAN></A></TD><TD class="language">Python 2.7</TD><TD class="verdict_ac">Accepted</TD><TD class="test"><BR></TD><TD class="runtime">0.015</TD><TD class="memory">160 KB</TD></TR>
Таким образом, из всего HTML страницы, я хочу, чтобы прочитать имя, THE_ROCK
(он присутствует в приведенном выше поддавки тег), и если что существует в этой странице, я хочу чтобы напечатать полные элементы (например, проблему, имя проблемы, verdict_ac, время выполнения и память) в этом теге <TR> </TR>
. Я понял, что могу использовать BeautifulSoup
, но я не знаю, как сравнивать вещи и печатать нужные элементы/теги.
Код:
res = br.submit()
final_url = res.geturl()
html_doc = br.open(final_url)
html_read = (html_doc.read())
soup = BeautifulSoup(data, convertEntities=BeautifulSoup.HTML_ENTITIES)
for row in soup.find_all('TR'):
print '\n'.join(row.stripped_strings)
Я пытаюсь найти TR
тег, но это не было полезным и никакого вывода не печатается. Может кто-нибудь сказать мне, где я делаю неправильно. Является ли мой подход неправильным или поток неправильный? Не могли бы вы рассказать мне, почему я не могу получить результат, как ожидалось. Заранее спасибо. Любая помощь приветствуется.
Когда я нахожу текст 'THE_ROCK', я хочу, чтобы напечатать весь' TR' тег, в котором этот текст существует – Dev