Я пытаюсь написать простое приложение, которое читает HTML с веб-страницы, преобразует его в строку и отображает определенные фрагменты этой строки пользователю. Однако, кажется, эти кусочки меняются! Каждый раз, когда я запускаю свой код, я получаю отличный результат! Вот код.Использование urllib с Python 3
# import urllib so we can get HTML source
from urllib.request import urlopen
# import time, so we can choose which date to read from
import time
# save HTML to a variable
content = urlopen("http://www.islamicfinder.org/prayerDetail.php?country=canada&city=Toronto&state=ON&lang")
# make HTML readable and covert HTML to a string
content = str(content.read())
# select part of the string containing the prayer time table
table = content[24885:24935]
print(table) # print to test what is being selected
Я не уверен, что здесь происходит.
Было бы лучше использовать библиотеку, которая анализирует html и может извлечь конкретный элемент, такой как таблица, основанная на его свойствах. beautifulsoup является одним из таких парсеров для python. Он доступен по адресу https://pypi.python.org/pypi/beautifulsoup4, и есть возможность использовать его для извлечения таблицы по адресу http://stackoverflow.com/questions/11790535/extracting-data-from-html-table , Использование его с http://www.islamicfinder.org/prayerDetail.php будет более сложным, поскольку источник просмотра показывает, что он не присваивает класс таблицам, а также их гнездится, но он присваивает один и тот же класс всем элементам td. –