Я думал, что lxml будет лучше для этой цели, но я открыт для лучших предложений. В основном я хочу, чтобы извлечь значения из таблицы, которая выглядит следующим - (что уже в переменном питоне):python извлекает значения из таблицы html
<thead><tr> .... </tr></thead>
<tbody>
<tr><td>col1val1</td><td>col2val1</td></tr>
<tr><td>col1val2</td><td>col2val2</td></tr>
<tr><td>col1val3</td><td>col2val3</td></tr>
</tbody>
Теперь поток, а и TBODY тегов находятся в пути и не нужны, так как-то мне нужно сначала отрезать эти теги, а затем пропустить все три строки по одной строке за раз. Мне нужно выполнить операцию (вставить в базу данных) с каждой полной строкой данных, прежде чем переходить к следующей строке.
Я думаю, что эти первые два ответа не работают, потому что таблица html находится в формате объекта Юникод.
'lxml' кажется хорошим выбором. – lanzz