Представьте, что у меня есть ситуация, когда мне нужно индексировать предложения. Позвольте мне объяснить это немного глубже.Лучший алгоритм для индексирования предложений
Например, у меня есть эти предложения:
- Красивое небо.
- Красивое небо мечты.
- Красивая мечта.
Насколько я могу себе представить, индекс должен выглядеть следующим образом:
alt text http://img7.imageshack.us/img7/4029/indexarb.png
Но я также хотел бы сделать поиск по любому из этих слов.
Например, если я выполняю поиск по «значению», он должен показать мне подключение к «красивому». Если я ищу «прекрасный», он должен дать мне связи с (предыдущим) «The», (далее) «небо» и «сон». Если я ищу «небо», он должен дать (предыдущее) подключение к «красивому» и т. Д.
Любые идеи? Может быть, вы знаете уже существующий алгоритм для такого рода проблем?
Использование ассоциативного массива позволит вам быстро разобрать предложения в Perl. Это намного быстрее, чем вы ожидали, и его можно эффективно сбрасывать в дереве, подобном структуре, для последующего использования языком более высокого уровня. Вы хотите алгоритм. – ojblass
@Lukas Šalkauskas, почему вы удалили этот вопрос? Здорово. На диаграмме имеется только опечатка. –