2009-07-17 3 views
0

ok, im создание поисковой системы. и модуль поиска, способный извлекать соответствующие слова. и теперь у меня есть список слов и их смещение в исходном исходном тексте. Это плохая идея использовать расстояние levenshtein для вычисления разницы между строкой запроса и частью исходного текста (начинаться с смещения заданного слова и до длины строки запроса). спросите, я думал, что это поможет мне быстрее генерировать выдержку.используя levenshtein расстояние для генерации выдержки

ему не нужен поиск близости и т. Д., Только обычные режимы «ЛЮБОЙ» и «ВСЕ». btw, результаты уже отсортированы, поэтому я только сейчас смотрю в выдержку. Благодарю.

ответ

1

Создайте отображение от одного до многих из текста в содержащиеся слова (и их количество). Этот вектор «сумка слов» может затем использоваться для множества разных методов.

+0

Это был мой план, но тогда я мог бы, возможно, этот метод мог бы сделать намного быстрее с меньшим количеством итераций, вот почему я спросил здесь. – kar

+0

Я не понимаю, какие итерации вы имеете в виду. Для создания этого вектора вам понадобится один проход. – bayer