У меня есть веб-страница, открытая и зарегистрированная с использованием кода webdriver. Использование webdriver для этого, потому что на странице требуется логин и различные другие действия, прежде чем я настроюсь на очистку.Использовать уже открытую веб-страницу (с селеном) для beautifulsoup?
Целью является очистка данных с этой открытой страницы. Нужно найти ссылки и открыть их, поэтому будет много сочетаний между selenium webdriver и BeautifulSoup.
Я посмотрел на документацию для BS4 и BeautifulSoup(open("ccc.html"))
выдает ошибку
soup = bs4.BeautifulSoup(open("https://m/search.mp?ss=Pr+Dn+Ts"))
OSError: [Errno 22] Invalid argument: ' https://m/search.mp?ss=Pr+Dn+Ts '
Я полагаю, это потому, что его не .html
?
см [как получить innerHTML из целой страницы в драйвере селеном] (https://stackoverflow.com/questions/35905517/how-to-get-innerhtml-of-whole-page-in-selenium-driver) – robyschek