Я работаю над проектом базы знаний с использованием полнотекстовой поисковой системы SQL Server 2008. Проект включен в статьи и файлы, где каждая статья имеет несколько файлов. В этих статьях весь контент чистый html.Как игнорировать теги html в Sql Server 2008 Полнотекстовый поиск
В настоящее время я успешно создал полнотекстовый каталог и индекс SQL Server 2008, а моя база данных совместима с версией 10.
Вот мои вопросы:
1) Можно ли игнорировать HTML-теги, более четко тексты, содержащие в «< ...>», при поиске в этих статьях, потому что если я хочу, чтобы искать DIV , таблица и т. д. не должно быть результата?
2) Статьи будут обновляться в любое время, поэтому полный текстовый индекс должен быть обновлен при вставке новой записи. Достаточно ли установить только «TRACK CHANGES AUTOMATIC» при создании полнотекстового каталога?
3) Мы можем использовать функцию FILESTREAM в дальнейшем, обладает ли SQL Server 2008 хорошей производительностью в файлах, используя полный текстовый индекс? Какие конкретные типы документов SQL Server 2008 хороши при индексировании?
С уважением
привет друг, я думаю, что лучшим решением будет заменить HTML с регулярным выражением„<(.|\n)*?>“с проверкой сборки SQL CLR эта ссылка http://justgeeks.blogspot.com/2008/08/adding-regular-expressions-regex-to-sql.html –