2008-10-01 6 views
1

Я обнаруживаю простое решение для поиска по ключевым словам с множественным числом. Я слышал о происходящем, но я не хочу использовать все его функции, только множественное/сингулярное преобразование. Язык - голландский. Посмотрите на http://www.snowball.tartarus.org раньше. Кто-нибудь знает простое решение для сингулярных множественных релевантных поисков? Спасибо заранее.Поисковые запросы Singular/множественного числа

ответ

2

Используйте словарь, список остановок (те, которые вы не хотите создавать), а также правила для языка. Если вы не знаете, голландцев, то я не могу вам помочь, но показать вам, как это было бы быть сделано на испанском языке, например:

  • Множественное оканчиваться с, если это не то, что это сделано
    • Если оно заканчивается с,
      • проверить, если это глагол или конъюгации заканчивая с, если он один, то это делается (глаголы могут быть добавлены в список игнорируемых слов)
      • , если это не глагол, удалить s
      • если d существует в словаре, сделано
      • , если оно не удаляет предыдущую букву и проверяет ее в словаре.
      • , если это еще не было, что это исключение, вам необходимо проверить вручную кода исключений (не могу сейчас думать о любой, но они всегда существуют :)

Конечно, это не будет напрямую переводиться на голландский.

В целом, стволовые уже сделаны и обеспечивают большую часть того, что вам нужно, почему бы вам не хотеть их?

1

Stemmers вызвали много раздражения пользователя, поэтому, если я использую один из них, все функции, кроме единственного/множественного числа, должны быть отключены. Поэтому необходимо использовать только множественные/сингулярные преобразования.

1

Ответ правильный, но стоит упомянуть, что на голландском языке имеется большое количество неправильных глаголов. Это приводит к большей проблеме поиска таблиц, чем набор единых правил.

Вам нужен доступ к корпусу, вы можете найти его для голландского языка здесь: http://corpus1.mpi.nl/ds/imdi_browser/