Я работаю над проектом по внедрению крупномасштабной индексации данных twitter для оптимизации поиска с использованием Apache Lucene. Lucene предоставляет инвертированный индекс для фильтрации блоков, которые соответствуют заданным критериям выбора.Оптимизация поиска с использованием Apache Lucene
Чтобы реализовать этот проект, как мне его заняться - Должен ли я установить Cloudera vm и продолжить? или Должен ли я развертывать Hadoop с Apache на платформе Ubuntu?
Причина, по которой я прошу об этом, заключается в том, что я не могу подтвердить, что Cloudera уже использует Lucene для оптимизации поиска.
Просьба сообщить.