2010-06-18 2 views
1

Я разрабатываю поисковую систему.Индексирование контента и синонимов поисковой системы

Я думаю о том, чтобы принимать уникальные слова, давая описание продуктов, а также обращение к API для получения синонимов и индексации их также.

«быстрый и мощный ноутбук»

даст следующие результаты ...

конечно «быстрый и мощный ноутбук» И еще одно поле с «ускоренным способной нетбуке»

синонимов конечно, не будет отображаться пользователю, но будет использоваться только для того, чтобы сделать результаты поиска более актуальными.

Что вы думаете об этой идее? Какие-нибудь подводные камни, которые вы видите? Кто-нибудь это делает?

+0

Один вызов этим методам заключается в том, что слово имеет несколько потенциальных синонимов с широким разным значением. Например, в запросе «Как отправить коробку» слово «корабль» может иметь синонимы, такие как «лодка» и «отправить». –

ответ

0

Слова с краткими синонимами в конечном итоге раздувают поиск. Если у вас есть 5 слов, у каждого есть 10 синомов, теперь вы делаете поиск около 50 слов.

+0

Можем ли мы использовать скрытую семантическую индексацию, чтобы помочь с этим? –

+0

Разве это не полностью уничтожило бы цель синонимов? – Wildhorn

Смежные вопросы