Я хотел бы, чтобы очистить содержимое вебов-сайт с аналогичной структурой вУплотненные Для контура с неравными субъектами
https://www.wellstar.org/locations/pages/default.aspx
Используя предоставленный веб-сайт в качестве основы, я хотел бы, чтобы извлечь имя местоположения и заголовок, связанный с этим местоположением. Я хочу, чтобы иметь возможность производить следующие действия:
WellStar Больницы
Wellstar АТЛАНТА МЕДИЦИНСКИЙ ЦЕНТР
WellStar Больницы
Wellstar АТЛАНТА медицинский центр ЮГ
...
WellStar Health Parks
PARKЭкуорт ЗДОРОВЬЕ
...
До сих пор я пытался вложенным цикл:
for type in soup.find_all("h3",class_="WebFont SpotBodyGreen"):
for name in soup.find_all("div",class_="PurpleBackgroundHeading"):
print(type.text, name.text)
выше for loop
возвращает дубликаты из-за каждое имя будучи сопряженным с каждым типом, независимо от представления на вебсайте. Любая помощь, будь то в виде кода и/или рекомендованных ресурсов для решения этой задачи, будет с большой благодарностью.
могли бы вы объяснить, что происходит в 'г [title] = [item.get_text (strip = True) для элемента в строке.select (". PurpleBackgroundHeading a")] 'line? Я подозреваю, что это то, где вы присоединяетесь к значению в ключе заголовка для словаря? Если да, то как я могу добавить другое значение для каждого ключа. Например, как я могу добавить адрес каждого местоположения в словарь? – Daniel
@ Даниэль, пожалуйста, сформулируйте это в отдельный вопрос, если вам нужна дополнительная помощь! Спасибо. – alecxe