2014-11-18 6 views
0

Я изменяю исходный код моркови для проекта. Acc. к алгоритму LINGO, он сначала генерирует наиболее вероятные метки и строит кластеры, которые лучше всего подходят для ярлыков? Итак, могу ли я ввести свой собственный набор меток на морковь, чтобы увидеть, как он группирует документы вокруг них?Могу ли я использовать свои собственные ярлыки для carrot2

ответ

0

К сожалению, вы не можете предоставить свои собственные ярлыки для кластеризации с Lingo.

С другой стороны, алгоритм назначения метки между документами очень прост в Lingo - если документ содержит слова метки, он будет присвоен метке. Таким образом, вы можете добиться такого же эффекта, например, индексируя свои документы в Lucene, а затем запрашивая индекс, используя предопределенные ярлыки, которые у вас есть.

+0

Acc. к ответу, который я предполагаю, самым важным и уникальным аспектом LINGO является его создание лейбла ?? –

+0

Исправить. Взгляните на [публикации Carrot2] (http://project.carrot2.org/publications.html) для некоторых статей, таких как [Lingo: алгоритм кластеризации результатов поиска на основе сингулярного декомпозиции значений] (http: //www.cs .put.poznan.pl/dweiss/site/publications/download/iipwm-osinski-weiss-stefanowski-2004-lingo.pdf) или [Алгоритм, основанный на концепции для кластеризации результатов поиска] (http: //doi.ieeecomputersociety. орг/10,1109/MIS.2005.38). –

Смежные вопросы