2010-05-29 2 views
1

Я написал экстрактор scrubyt, основанный на технике обучения, то есть, указав текущий текст на странице и получив его, чтобы выработать сами выражения XPath. Однако теперь я хочу экспортировать экстрактор, чтобы он мог использоваться, даже когда страница была изменена.Как экспортировать экстрактор scrubyt?

Документация для scrubyt, кажется, повсюду сейчас, но из того, что я могу найти, я мог бы поставить строку extractor.export(__FILE__), и она должна работать. Это не так - я просто ошибаюсь, говоря, что существует неправильное количество аргументов для экспорта, оно должно быть равным 0. Я пробовал это без каких-либо аргументов, и он все еще терпит неудачу.

Я бы спросил на форуме scrubyt, но кажется, что никто не был там целую вечность!

Любые идеи, что здесь делать?

ответ

1

Просто была такая же проблема, и пытался "ставит google_data.export()" (пытаются получить некоторые вещи из Google)

Это дало мне следующее:

=== Extractor дерево = ==

export() is not working at the moment, due to the removal or 

ParseTree, ruby2ruby и RubyInline. На данный момент, если вы используете примеры, вы можете их заменить вручную на основе приведенного ниже результата. Так что, если ваш шаблон в обучении экстрактор выглядит как

book "Ruby Cookbook" 

and you see the following below: 

[book] /table[1]/tr/td[2] 

then replace "Ruby Cookbook" with "/table[1]/tr/td[2]" (and all the 

другие XPaths), и вы готовы! [ссылка]/тело/DIV/DIV/DIV/DIV/DIV/ол/li/h3/а

, который дал мне XPath я искал

scrubyt версии 0.4.06

Смежные вопросы