5

Можно ли получить список слов/стоп-слов Full Text Search из SQL Server 2005 путем запроса к базе данных?Query SQl Server 2005 Полнотекстовый поиск шумовых/стоп-слов

Я знаю, что шумовые слова находятся в текстовом файле ~/FTData/noiseEng.txt, но этот файл недоступен для нашего приложения.

Я смотрю таблицы sys.fulltext_ *, но они, похоже, не имеют слов.

ответ

2

Оказывается, что это не возможно в SQL 2005, но в SQL Server 2008.

Advanced Queries for Using SQL Server 2008 Full Text Search StopWords/StopLists

Следующий запрос возвращает список всех в игнорируемых слов, которые поставляются с SQL Server, 2008. Это хороший улучшение, вы не можете сделать это в SQL Server 2005.

Stopwords and Stoplists - SQL Server 2008

SQL Server 2005 шумовые слова были заменены на стоп-слова. Когда база данных обновлена ​​до SQL Server 2008 с предыдущей версии, файлы шум слово больше не используется в SQL Server 2008. Однако шум слово файлы не хранящихся в папке FTDATA \ FTNoiseThesaurusBak, и вы, , можете использовать их позже при обновлении или , строя соответствующий SQL Server 2008 стоп-листы. Для получения информации о обновления файлов шумового слова до стоп-листов см. Полнотекстовый поиск Обновление.

0

Я просто скопирую файл шумовых слов от \Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData в свое приложение и использую его для разметки шумовых слов.

Public Function StripNoiseWords(ByVal s As String) As String 
     Dim NoiseWords As String = ReadFile("/Standard/Core/Config/noiseENU.txt").Trim 
     Dim NoiseWordsRegex As String = Regex.Replace(NoiseWords, "\s+", "|") ' about|after|all|also etc. 
     NoiseWordsRegex = String.Format("\s?\b(?:{0})\b\s?", NoiseWordsRegex) 
     Dim Result As String = Regex.Replace(s, NoiseWordsRegex, " ", RegexOptions.IgnoreCase) ' replace each noise word with a space 
     Result = Regex.Replace(Result, "\s+", " ") ' eliminate any multiple spaces 
     Return Result 
    End Function 
+0

Привет, Herb, это может работать, но наше приложение работает на серверах клиентов, которые обычно блокируются, поэтому доступ к файлу ограничен. Получение клиентов для копирования и вставки шумовых слов не было бы приемлемым решением, к сожалению –

Смежные вопросы