Я хотел бы использовать полнотекстовую поисковую систему, и я решил стать Сфинкс. Но я работаю с платформой hadoop и Big data, а Sphinx Search совместим с mysql DB, который не может обрабатывать большие данные.Сфинкс и большие данные
Итак, есть ли способ использовать Sphinx с большими средами данных, такими как hadoop или HDFS или любая другая база данных nosql?
Так я смогу хранить файлы TSV или JSON в HDFS и индексировать их в sphinx? И как я могу это сделать? –
Вероятно, самым простым был бы небольшой скрипт, который перечислял бы все файлы и выводил их содержимое. Это используется в сценарии TSVpipe. (Я не думаю, что есть еще один JSON-указатель потока, поэтому мне нужно будет преобразовать JSON в что-то еще в скрипте. – barryhunter
это не большой вопрос, но вопрос в том, что я могу индексировать сохраненные TSV-файлы в HDFS с помощью Sphinx? –