Вы не можете, потому что это ссылка для самостоятельной ссылки. У вас есть уже открыл документ.
A #
в URL-адресе означает местоположение в документе. Когда URL начинает с #
, он находится в пределах текущий документ; браузер будет прокручиваться до любого Идентификатора, названного в честь #
. В следующем примере, нажав на <a href="#footer">
ссылку инструктирует браузер для прокрутки документа, чтобы поместить <div id="footer">
элемент в верхней части окна браузера:
<a href="#footer">to the end of the document</a>
<!-- long document follows -->
<div id="footer">Something at the bottom of the document</div>
Когда URL состоит только из #
, то URL это не-op. Это заполнитель, поскольку JavaScript для перехвата ссылки обычно используется. Вы можете полностью игнорировать его при обработке этого документа с помощью Python. Ваш Python HTML-парсер не является браузером, JavaScript не выполняется для обработки mouseclick в этом элементе ссылки. Нет даже музлик.
Если вы в попытку обработать JavaScript-приводимую страницу, вы можете либо использовать отладчик JavaScript (поставляется с большинством браузеров), чтобы выяснить, что она делает, или запустить обезглавленный браузер, управляемый Python. Вы можете использовать Ghost.py сделать последнее:
from ghost import Ghost
ghost = Ghost()
page, extra_resources = ghost.open("http://jeanphi.fr")
assert page.http_status==200 and 'jeanphix' in ghost.content
Это запускает обезглавленное Webkit браузер.
http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code – user2485710
Непонятно, с чего вы начинаете, или точно, что вы просите , У вас есть HTML-файл, и вы хотите проанализировать атрибут 'href' для различных тегов' '? «Открывать ссылку», вы имеете в виду в веб-браузере или в фоновом режиме, используя что-то вроде «urllib2»? –
Я хочу открыть ссылку с href = "#" и class = "example" .... Если скрипт python обнаруживает, что класс равен «примеру», откройте его! Однако, как я могу открыть его, когда href является «#»? – ant0nisk