2014-02-04 6 views
-2

Я понятия не имею, возможно ли это ... Что я хочу сделать, так это вернуть значение xpath из FIREFOX при вызове .. используя python. Могу ли я это сделать без указания URL-адреса?Как получить значение xpath с помощью python текущего экземпляра?

К сожалению у меня нет больше деталей и спасибо за любые ответы, которые вы можете быть в состоянии обеспечить

+0

Я не думаю, что вы понимаете, что такое xpath. –

+0

Вы были бы правы, я не уверен, что это такое. Общаюсь с хром. Я заметил, что у каждого элемента есть xpath, который, как я думал, был доступным для этого значения. – wonderstruck80

+0

Xpath - это способ доступа к элементам в деревьях XML/HTML. Я до сих пор не знаю, о чем вы спрашиваете. Предоставление образца сценария и желаемого поведения поможет. –

ответ

1

Похоже, вы просто хотите, чтобы ваши ноги мокрые с некоторыми web scraping. В принципе, идея веб-соскабливания, принимает html, который возвращается веб-сайт, и анализирует его для соответствующей информации.

Тема на самом деле довольно широкая, и полное описание выходит за рамки области, но scrapy представляет собой пакет python, который делает это относительно простым.

Там в учебник здесь: scrapy tutorial

Вы также можете захотеть взглянуть на Casperjs взаимодействовать с веб-страниц в более богатым способом.

+0

Я не совсем уверен, что это то, что я ищу. Используя этот метод, модули python открывают или открывают веб-сайты непосредственно для очистки, что не будет работать в моем случае (URL-адрес - страница входа в систему). Не могли бы вы указать мне в правильном направлении? – wonderstruck80

+0

@ user21267 Если вы хотите программно взаимодействовать с веб-страницей, войти в систему и еще много чего, то вы больше не имеете дело со статическими страницами. Это означает, что вам нужно более активно взаимодействовать с веб-страницами, и я тогда посмотрю на Каспердж. Стоит отметить, что вам может потребоваться гораздо более глубокое понимание того, как работают веб-страницы, в частности роль GET и POST-запросов при входе в систему. Однако Casperjs - это правильный старт. –

Смежные вопросы