Я использую BeautifulSoup для очистки сайта, однако этот сайт отличается. На soup.prettify() я возвращаю код Javascript, много материала. Я хочу очистить этот веб-сайт от данных фактического веб-сайта (название компании, номер телефона и т. Д.). Есть ли способ очистить эти сценарии, такие как Main.js, чтобы получить данные, которые отображаются на веб-сайте для меня?Веб-скребок Javascript Использование Python
Clear версия:
Кодекс:
<script src="/docs/Main.js" type="text/javascript" language="javascript"></script>
Это содержит текст, который находится на сайте. Я хотел бы очистить этот текст, однако он заполнен с использованием JS not HTML (который я использовал для использования BeautifulSoup для).
Не могли бы вы уточнить, что вы пытаетесь сделать? –
Возможный дубликат [Веб-соскабливание страницы JavaScript с помощью Python] (http://stackoverflow.com/questions/8049520/web-scraping-javascript-page-with-python) –
@ AlexanderO'Mara Извините, обновил его –