Я строю алгоритм с инвертированным индексом. Я буду хранить индекс в виде хэш-таблицы в файле или базе данных. Обновление индекса включает 1. Загрузка его в память из файла или базы данных 2. Преобразование его в объект 3. Внесение изменений в объект 4. Преобразование объекта в строку 5. Сохранение его в файле или база данныхМетоды, чтобы избежать условий гонки в алгоритме с инвертированным индексом
Теперь есть несколько источников, которые подают данные в индекс. Если два или более источника пытаются одновременно подавать данные, есть неплохие шансы на участие в гоночных условиях.
Каковы наиболее известные методы, чтобы избежать этого?
Спасибо за понимание. Будет ли хорошей идеей хранить индекс в базе данных в полностью нормализованной форме? Или это будет потреблять слишком много места и времени по сравнению с сырыми файлами? –
См. [Этот вопрос] (http://stackoverflow.com/questions/2451919/what-is-the-best-way-to-build-inverted-index) –