Рассмотрите возможность использования Apache Phoenix на HBase. Он предоставит вам низкозатратные SQL-запросы (поэтому он подходит для OLTP и прост в использовании для OLAP) для данных, хранящихся в HBase, поэтому вам не нужно беспокоиться о синхронизации. Он также имеет функции NoSQL, такие как возможность динамического добавления столбцов во время запроса.
Чтобы удовлетворить ваш прецедент, вы можете запустить Phoenix для OLTP и второй экземпляр Phoenix на чтение реплики для запуска табличных соединений для OLAP.
http://www.cloudera.com/documentation/enterprise/5-4-x/topics/admin_hbase_read_replicas.html
Secondary replicas are refreshed at intervals controlled by a timer (hbase.regionserver.storefile.refresh.period), and so are guaranteed to be at most that interval of milliseconds behind the primary RegionServer.
Это решение удовлетворяет требованиям к OLTP, OLAP, и практически в режиме реального времени с синхронизацией, давая вашей транзакционной масштабируемость базы данных, которые вы не легко с MySQL. Apache Phoenix также предлагает полную интеграцию с экосистемой Hadoop, поэтому он будет хорошо интегрироваться с вашим текущим стеком аналитики.
Можете ли вы предоставить некоторые сведения о том, почему sqoop не соответствует вашим требованиям? – Rachel
Спасибо за ваше время, например: First: У меня есть таблица A и таблица B, которая имеет отношение от одного до многих, и я хочу объединить их в одну таблицу C в таблице hbase (Должны быть объединенные записи). Во-вторых: Sqoop является пакетным, что не является решением почти в реальном времени. Нам нужны новые записи в таблицах A и B, мы хотим, чтобы эта запись синхронизировалась с таблицей Hbase C сразу. – user1330526