Я хотел бы получить консенсус сообщества о хорошем дизайне, чтобы иметь возможность хранить и запрашивать число слов в частоте. Я создаю приложение, в котором я должен разбирать текстовые входы и хранить, сколько раз появилось слово (со временем). Таким образом, учитывая следующие входы:Отслеживание/подсчет частоты слов
- "Убить насмешливая птица"
- "Глумление пианиста"
магазин будет принимать следующие значения:
Word Count
-------------
To 1
Kill 1
A 2
Mocking 2
Bird 1
Piano 1
Player 1
И позже способный быстро запросить значение счета для данного произвольного слова.
Мой текущий план состоит в том, чтобы просто хранить слова и подсчеты в базе данных и полагаться на значения кеширования слов ... Но я подозреваю, что я не получу достаточного количества кеш-хитов, чтобы сделать это долговременным решением.
Может ли кто-нибудь предложить алгоритмы, структуры данных или любую другую идею, которая могла бы сделать это эффективным решением?