2015-05-26 7 views
0

Что им пытаются сделать, это скребок и есть страница Логин, им наполняя два из трех значений, необходимых для получения на следующей страницеPython Анализировать одна строка XML

скребок нужен логин, пароль а затем токен

im autofilling имя пользователя и пароль и ive сужают html-ответ до одного тега ввода в python.

Код тегов:

<input type="hidden" name="licence[_csrf_token]" value="SOME RANDOM CHECKSUM" id="licence__csrf_token" /> 

есть ли способ получить это, и по тому, как контрольная сумма динамична, как в нем изменения длины.

+0

Что вы имеете в виду под «получать это»? Кроме того, какие инструменты вы использовали для извлечения тега ввода из HTML? –

ответ

0

BeautifulSoup один хороший способ для разбора произвольный HTML:

from bs4 import BeautifulSoup 

html_doc = '''<input type="hidden" 
        name="licence[_csrf_token]" 
        value="SOME RANDOM CHECKSUM" 
        id="licence__csrf_token" />''' 

soup = BeautifulSoup(html_doc) 
print soup.input['value'] 
Смежные вопросы