Каковы преимущества Cassandra над HBase, когда дело доходит до рабочих мест MapReduce?Cassandra vs HBase for Hadoop jobs
У меня есть много небольших файлов, которые я бы хотел переместить из HDFS в базу данных и чтобы файлы были введены для заданий MapReduce. Я не беру все файлы, но для определенного пользователя, поэтому, возможно, всю строку, по крайней мере, для семейства столбцов. Я мог брать файлы с определенного периода.
Я знаю, что HBase является базой данных Hadoop, поэтому я ожидаю, что это интегрируется хорошо для того, что мне нужно, но я также прочитал, что Cassandra имеет гораздо лучшую производительность. Но я хотел бы знать, в чем ситуация, когда вы используете его в качестве входных данных для MapReduce вакансий. Является ли производительность все еще намного лучше, чем в случае HBase?
Я должен подчеркнуть, что я не ищу сравнение HBase и Cassandra вообще, но в конкретных случаях работы MapReduce. Вопросы, подобные this, не говорят конкретно о производительности в случае заданий MapReduce. Кроме того, я ищу новую информацию (вопрос, который я упомянул, с 2011 года, я считаю, что с тех пор, возможно, были некоторые изменения).
Благодарим за предложение, но этот вопрос и ответы могут быть немного устаревшими (сколько изменений было внесено с 2011 года?). Кроме того, меня не интересует только сравнение баз данных в целом, но хотелось бы знать, какая из них имеет лучшую производительность в случае заданий MapReduce и информации об этом нет. – Marko