Моя функция анализирует тексты и удаляет короткие слова, такие как «a», «on», «in», «on», «at» и т. Д.Где я должен хранить список стоп-слов?
Список этих слов может быть изменен в будущем , Кроме того, переключение между различными списками (например, для разных языков) также может быть вариантом.
Итак, где я должен хранить такой список?
- О 50-200 слов
- Многие читает каждую минуту
- Почти нет записи (модификации) - например, раз в несколько месяцев
у меня есть эти варианты в моей голове:
- список внутри кода (быстрый, но это не звучит как хорошая практика)
- Отдельный файл «stop_words.txt» (как быстро читается из файла? должен ли я читать одни и те же данные из одного и того же файла каждые несколько секунд, я вызываю ту же функцию?)
- Таблица базы данных. Было бы действительно эффективно, когда список слов должен быть почти статичным?
Я использую Ruby on Rails (если это имеет значение).