2009-11-01 3 views
0

Я новичок в RoR. Я хочу разработать приложение для рельсов, которое могло бы искать информацию о рейсе из моего приложения rails, получать информацию о полете с различных авиакомпаний (например, аэразийские и малайзийские авиалинии). отобразите эти результаты в моем приложении rails.
Мой модуль поиска должен включать в себя следующие текстовые поля:Скребок экрана с рубинами на рельсах

From: Kuala Lumpur 
To: Dubai 
Departure Date:2/11/2009 
Return date: 19/11/2009 
Departure Time: 12:00 
Number of tickets: 2 

пользователь получает ввести информацию выше на моем сайте и
скрипт должен искать рейсы в соответствии с этой информацией о различных авиакомпаний сайтов и
отображения результатов с тегом, который авиакомпании предоставляют этот рейс.

Можно использовать либо "Scrapi" или "Scrubyt"

+4

У вас есть конкретный вопрос, или вы хотите, чтобы кто-то написать т все для вас? –

+0

Я просто хочу, чтобы руководство на hw начиналось, bt я не возражаю, если вы можете написать его для меня. – hassan

+0

Хотя некоторые разработчики могут нахмуриться на выскабливание, причина, по которой ваш вопрос был понижен, заключается не только в том, что скребок плохой, а потому, что вы, похоже, не знаете, что делаете. Вы показываете нам простой текст в качестве примера. Скребок экрана включает в себя использование исходного исходного кода html для выбора элементов через их атрибуты и значения атрибутов. Вы можете использовать простой текст, чтобы сообщить скрипту scrape, но его всегда будет нужно больше, чем это произошло. контекст с точки зрения тегов («div»), атрибутов («id»), значений («id = 3»), &/или текста («..> sdfd "). Изучите драгоценный камень watir-webdriver. –

ответ

5

может кто-нибудь предложить помощь?

Не делайте этого. Найдите другую схему быстрого обогащения. Или, по крайней мере, не полагайтесь на скрипинг экрана.

Существует так много возможностей для того, чтобы оно пошло не так. Найдите другой способ получения информации для агрегирования. Используйте API, если они существуют, и сохраняют расписания в базах данных (они редко меняются в зависимости от недели к неделе). Хранение вещей на месте делает вещи быстрее для ваших клиентов, а также позволяет вам предоставлять больше услуг.

Вот лишь некоторые из возможных проблем с экраном соскоба:

  • Незначительные обновления на сайты вы скребковые можете сломать инструмент.
  • Скремблирование с IP-адреса вашего сервера может быть отклонено.
  • В зависимости от информации вы могли бы даже получить иск.
2

Чтобы начать с выскабливание, вы можете обратиться к столбу -

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-using.html (Simple Рубиновый Скребок экрана с помощью Mechanize, Hpricot и XPath)

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-in-just-5.html (Simple Рубиновый Скребок экрана всего 5 линии без использования XPath)

Это просто для понимания

0

кашель кашель Watir-WebDriver (драгоценный камень)

DOM-не может скрыть

Смежные вопросы