Сайт, который я пытаюсь очистить, использует js для создания файла cookie. Я думал, что я могу создать cookie в python, а затем использовать этот файл cookie для очистки сайта. Однако я не знаю, как это сделать. У кого-нибудь есть идеи?Подделка печенья, чтобы очистить сайт в python
ответ
Пожалуйста, см. Python httplib2 - Handling Cookies in HTTP Form Posts для примера добавления файла cookie к запросу.
Мне часто приходится автоматизировать задачи в веб-приложениях . Мне нравится делать это на уровне протокола, моделируя взаимодействие реального пользователячерез HTTP. Python поставляется с двумя встроенными модулями для этого: urllib (интерфейс верхнего уровня Web ) и httplib (нижний уровень HTTP-интерфейс).
+1 выглядит как действительно полезная библиотека. Очень релевантная ссылка! –
Спасибо, мне удалось заставить его работать :) –
Если вы хотите больше задействовать эмуляцию браузера (включая настройки файлов cookie), посмотрите mechanize. Возможности моделирования практически завершены (к сожалению, поддержка Javascript недоступна): я использовал его для создания нескольких скребок с большим успехом.
Есть несколько решений для браузера удаленного управления. Мне нравится selenium, тем более что я могу запустить его в виртуальном фреймбуфере Xwindows. (скриншоты все еще работают отлично.) Не знаю много о других. –
mechanize не является автоматизированным браузером, он эмулирует браузер на уровне HTTP-запросов и ответов. – jkp
Это выглядит интересно, я рассмотрю его –
- 1. Anti-подделка вопросы печенья после развертывания
- 2. Очистить массив печенья PHP
- 3. Подделка объекта в python
- 4. Подделка вставки в очередь Python
- 5. Помощи с регулярным выражением, чтобы очистить сайт
- 6. Узел Cheerio, чтобы очистить весь сайт
- 7. Войдите на сайт .NET, чтобы очистить данные
- 8. Анти Подделка печенье отсутствует в Internet Explorer
- 9. Невозможно, чтобы очистить этот сайт фильма с помощью BeautifulSoup
- 10. Как очистить сайт AJAX?
- 11. Как очистить сайт, требующий входа в систему с помощью Python
- 12. Python нежадное регулярное выражения, чтобы очистить XML
- 13. Извлечение печенья
- 14. Преобразование печенья строки в Python Dict
- 15. Сценарий безопасности, чтобы очистить кеш и немедленно покинуть веб-сайт
- 16. cronjob: скручивание, чтобы очистить сайт и запустить команду, если down
- 17. Сбор печенья
- 18. Экран Очистить сайт с помощью python (на стороне сервера)
- 19. Реальное разрешение экрана не подделка
- 20. Очистить переменную в python
- 21. бесконечный свиток - как очистить сайт
- 22. Хранение печенья
- 23. Не удалось очистить конкретный сайт, используя python, urllib2
- 24. Экранирование значения печенья, чтобы предотвратить SQL-инъекции
- 25. Подделка имя функции укупорочное в
- 26. Подделка поддомена в google analytics
- 27. Socket.IO Подделка гнезда
- 28. Подделка ширины полосы прокрутки
- 29. пользователя/браузер дактилоскопии без печенья
- 30. Очистить sys.argv в python
Не будет ли это вообще не работать, потому что сайт может вставить цифровую подпись в файл cookie, чтобы убедиться, что он пришел с сайта? – Tom
Он использует javascript для создания файла cookie, поэтому я знаю, как он создан. –