2012-03-30 1 views
4

Я новорожденный программист, все еще программирующий из книги на моей Alt + Tab. Одна из первых программ, которые я хочу создать, - помочь моей маме в ее работе. Мне нужно знать, могу ли я использовать Python для его создания.Может ли автоматизация веб-сайтов быть выполнена в Python?

Необходимо:

  1. Go онлайн и войти в с учетом/пасс.

  2. Выполните поиск с определенными критериями (использование поисковой системы сайта)

  3. Просмотреть все результаты и выбрать только самые новые из них.

  4. Отсортировать их.

  5. Сообщите мне, чтобы новые добавления были замечены в тот момент, когда они размещены на веб-сайте.

Из того, что я вижу, сайт говорит: .cgi в конце.

Я знаю, что python может подключаться, загружать текст со страницы и сортировать необходимую информацию, но может ли она войти в систему, использовать поисковую систему и выбрать нужные мне параметры?

Я не хочу пропускать свой учебный процесс, но я так серьезно отношусь к этому проекту. Я готов удержать Python и начать изучать язык, который может это сделать!

Я буду очень признателен за ваше руководство! Спасибо за ваше время!

AJ

+6

Python - это язык общего назначения. Да, он может это сделать или вообще что-то еще. – agf

+1

Да, вы можете это сделать. Прочтите материал, связанный в приведенных ниже ответах, и попытайтесь начать работу над проектом. Используйте google для поиска решений для своих проблем (существует множество рецептов python, и официальные документы python.org содержат множество информации), и найдите существующие ответы здесь, которые соответствуют вашей проблеме. Как только вы застряли, придите сюда и задайте конкретный вопрос с четким, кратким и полным примером, включая ваш код, и проблемным вводом и выводом. Удачи и счастливого кодирования! – Marcin

+0

Возможно, вам удастся получить базовое представление о том, как работает веб (читайте об HTTP, HTML и XHTML и т. Д.). Кроме того, люди очень хотели, чтобы их хорошие ответы были проголосованы, и чтобы их ответ был принят, если это полное решение вашего вопроса. – Marcin

ответ

1

Python так же способен сделать это, как и любой другой язык, однако вы будете хотеть смотреть на вещи, как httplib и понимать печеньем и запросов HTTP. Так что да, может.

Это станет вашим лучшим другом: http://docs.python.org/

4

Я думаю, вы должны взглянуть на проект Mechanize. Это автономный браузер на Python, так что вы можете легко представить формы и вещи такого характера и поддерживать сеанс. Затем вы захотите использовать lxml.html или BeautifulSoup для проверки документа (хотя сам механизм содержит некоторые инструменты для проверки документов).

3

Да, это возможно. В частности, вы захотите использовать что-то вроде mechanize для обработки веб-ролика.

1

Если я хорошо понимаю, идея вашей программы - сделать сеанс автоматического просмотра. Так что да, это возможно. Не важно, в каком запрограммированном веб-сайте (cgi, php и т. Д.). Все, что вам нужно, - отправить данные через post/get (например, настоящий браузер) и обработать возврат (regexp и т. Д.).

Успехов

4

Чтобы добавить блестящий список пакетов комментировали многие, вы можете использовать Selenium тоже.

1

Я хотел бы указать, что в зависимости от того, на каком сайте вы находитесь, может быть более эффективный способ (возможно, веб-сервис), чем очищать данные со страницы и работать с механизатором/селеном, чтобы делать то, что вы хотите. Если вы находитесь в Интернете, инструменты драйвера браузера - это молотки, и они будут получать винты в дереве, но иногда другой инструмент будет работать лучше.

0

Вы можете сделать это с большим удовольствием с помощью визуального инструмента irobotsoft. Проверьте быстрые демонстрации здесь: http://www.irobotsoft.com/help/, затем задавайте вопросы на своем форуме.

Смежные вопросы