Мне очень хотелось бы знать, как теги и поиск Stack Overflow архивируются, потому что это работает очень хорошо.Оптимальная архитектура данных для тегов, облаков и поиска (например, StackOverflow)?
Что такое хорошая база/модель поиска, если я хочу сделать все следующие:
- Запоминание Метки на различных сущностей, (как нормированная т.е. Entity, Tag и Entity_Tag таблицы?)
- Поиск объектов с определенными тегами
- Построение облако тегов всех тегов, которые применяются к определенному результату поиска набор
- Как показать список тегов для каждого элемента в результатах поиска?
Возможно, имеет смысл хранить тег в нормализованном виде, но и в качестве пространства-разделителей строки для целей # 2, # 4, и, возможно, # 3. Мысли?
Я слышал, что он сказал, что Stack Overflow использует Lucene для поиска. Это правда? Я слышал пару подкастов, обсуждавших оптимизацию SQL, но ничего о Lucene. Если они используют Lucene, мне интересно, сколько из результатов поиска происходит от Lucene, и есть ли облако тегов «сверла» вниз от Lucene.
косяка upmod этого поста достаточно – Shawn 2009-01-03 21:16:48