2011-12-26 2 views
0

Можно ли написать программу, чтобы получить результат онлайн-поиска?Можно ли написать программу, чтобы получить результат онлайн-поиска?

В частности, я хочу, чтобы данные из http://portal.uspto.gov/external/portal/pair

выборки данных являются числом приложений, например 9078871,10595401

Да, у них есть CAPTCHAs, и я готов к типу тех, кто вручную. Проблема в том, что у меня более 500 номеров приложений, что мне делать? Есть ли более простой способ для меня сделать это?

Заранее благодарен! Кроме того, поисковая система, похоже, написана в javascript, но я не совсем уверен.

+0

ссылка не действительна – yurib

+2

Это известное слово "scraping". Вы можете найти «скребок python» или обратиться к чему-то вроде: http://stackoverflow.com/questions/2081586/web-scraping-with-python –

ответ

0

Несомненно, это возможно, и почему этого не должно быть.

Я не знаю вашего пробела в знаниях, который позволит вам архивировать эту задачу, поскольку вы не указали это.

шаг за шагом ...

  1. Анализ кода на веб-сайте»s, чтобы увидеть, как ссылки и их содержимое.
  2. Скачать исходный код programaticly
  3. Сформировать гиперссылка к результатам поиска
  4. разбирает соответствующие данные (я всегда делал это с некоторыми уродливыми регулярными выражениями)

откапывал я немного в сайт, который вы упомянули, и что действительно можно сказать, это то, что это не будет 1-часовое действие, поскольку оно написано на Java (JSP, Java Server Pages).

Что я до сих пор обнаружил, так это то, что вам сначала нужно написать эквивалент функции getDossier или использовать элемент управления Webbrowser, который позволяет вам вручную вызвать javascript, чтобы получить результаты поиска. Затем вы можете просто испечь некоторые регулярные выражения, чтобы проанализировать данные из таблицы.

Смежные вопросы