2011-01-24 5 views
4

Как написать простой скрипт (в cURL/python/ruby ​​/ bash/perl/java), который входит в систему okcupid и подсчитывает, сколько сообщений я получал каждый день?обходной сайт, нуждающийся в аутентификации

Выход будет что-то вроде:

1/21/2011 1 messages 
1/22/2011 0 messages 
1/23/2011 2 messages 
1/24/2011 1 messages 

Основная проблема заключается в том, что я никогда не писал веб-сканер раньше. Я понятия не имею, как программно войти на сайт, например, okcupid. Как сохранить аутентификацию при загрузке разных страниц? и т.д ..

После того, как я получаю доступ к необработанной HTML, я буду в порядке с помощью регулярных выражений и карт и т.д.

+2

Способ использовать силу кретины, чтобы найти любовь. Kudos =) –

+0

звучит так, как вам нужно узнать cURL .. – Brynjar

+0

@George: Спасибо !, @ Brynjar: cURL тоже будет хорошо, хотя я никогда не использовал его. Не могли бы вы разместить некоторые подробности? – pokerface

ответ

2

Вот решение с помощью Curl, который загружает первую страницу почтового ящика. Правильное решение будет перебирать последний шаг для каждой страницы сообщений. $USERNAME и $PASSWORD необходимо заполнить информацией.

#!/bin/sh 

## Initialize the cookie-jar 
curl --cookie-jar cjar --output /dev/null https://www.okcupid.com/login 

## Login and save the resulting HTML file as loginResult.html (for debugging purposes) 
curl --cookie cjar --cookie-jar cjar \ 
    --data 'dest=/?' \ 
    --data 'username=$USERNAME' \ 
    --data 'password=$PASSWORD' \ 
    --location \ 
    --output loginResult.html \ 
    https://www.okcupid.com/login 

## Download the inbox and save it as inbox.html 
curl --cookie cjar \ 
    --output inbox.html \ 
    http://www.okcupid.com/messages 

Этот метод объясняется в video tutorial about cURL.

Смежные вопросы