Первая попытка использования python и после дня google мой старый мозг еще более запутан.Извлечение значения из очищенной веб-страницы
Я использовал pycurl для регистрации через прокси-сервер ntlm и очистите страницу, а затем использовал beautifulsoup, чтобы придать результат.
Я хочу извлечь 3 значения из вывода prettify и сохранить их как переменные. Страница динамически генерируется, поэтому их местоположение на странице меняется. 3 ярлыка появляются только один раз на странице, и их местоположение по сравнению с их соответствующими значениями является постоянным.
Как извлечь значения Value1, Value2 и Value3 из вывода prettify и сохранить их как переменные.
Эти 3 oneliners - это то, что мне нужно сделать в python.
grep -A 3 "Label1" prettify.txt | tail -n 1 | awk '{print $ 1}'
grep "Label2" prettify.txt | awk '{print $ 3}'
grep -B 4 "Label3" prettify.txt | awk '{print $ 1}' RS = [FS =] | Хвост -n 1
экстракт 1
<b>
<font color="Red">
Label1
</font>
<font color="blue">
Value1
</font>
</b>
<br />
Label2: Value2
<br />
Extract 2
<li>
<font color="green">
[value3]
</font>
<font color="red">
Label3
</font>
</li>
В чем вопрос? Какой код вы пробовали? Что не работает? –
Вопрос: Как извлечь Value1, Value2 и Value3 из вывода prettify и сохранить их как переменные. – newb
Подсказка: ** Обновление ** вопрос - это ожидание. Комментарий не помогает, поскольку он просто повторяет вопрос. –