2016-03-15 4 views
2

Было бы хорошо, если бы я знал различные способы загрузки данных в хранилище данных Azure SQL Data Warehouse.Azure SQL Data Warehouse

Я мог подключиться к Azure SQL DW, используя JDBC с моей машины Ubuntu.

  1. Есть ли какой-либо прямой способ загрузки из хранилища Azure Blob в Azure SQL DW без использования Azure Data Factory?

  2. Способы загрузки данных из Ubuntu в Azure SQL DW.

  3. API Java для связи с Azure.

  4. Непосредственная загрузка данных из HDInsights в SQL DW.

Благодаря

+0

«API Java для общения с Azure»? В частности, для подключения к Azure SQL DW и выполнения запросов? Или выполнять задачи администратора в Azure? Можете ли вы уточнить, какие задачи? – GregGalloway

ответ

1

этот намек немного сумасшедшим, но он будет работать. взять локальный сервер sqm vm и настроить транзакционную репликацию Azure SQL DB. ->https://channel9.msdn.com/Shows/Data-Exposed/Azure-SQL-DB-Transactional-Replication

Идет таким образом, чтобы заполнить ваш лазурный sql db. вам нужно подключить ubuntu (JDBC), чтобы вставить весь контент на сервер sql. Это позволит реплицировать ваши данные на azure sql db. И лазурь БД SQL может быть легко перенесены в лазурной SQL ВЕС с двумя ступенями ;-)

https://azure.microsoft.com/en-us/documentation/articles/sql-data-warehouse-get-started-provision/

вашу пользу, вы подключаетесь с низкой задержкой на локальный сервер SQL и просто ждать, пока транзакционной репликации не будет сделано. ;-)

С уважением Патрик

+0

Спасибо, Патрик. И что касается HDInsights и SQL DW - я не мог найти документацию для подключения обоих. –

+0

@ Lambo-Fan вы делаете одноразовую миграцию или ежедневное обновление? Я не уверен, что этот подход идеально подходит для ежедневного обновления. – GregGalloway

5

Самым лучшим и быстрым способом загрузки данных в Azure SQL DW является использование Polybase для загрузки разграниченных плоских файлов, сидя в Azure Blob Storage. См. Описание Полибазы here.

Для загрузки из HDInsight предположим, что вы можете использовать SQOOP (хотя я еще не пробовал загрузить Azure SQL DW), но лучший подход заключается в том, чтобы записать HDInsight в плоский файл (например, вставив во внешнюю таблицу в Hadoop), а затем с помощью Polybase в Azure SQL DW для чтения файлов.

Извините, я не могу помочь по вашим другим вопросам о Java и Ubuntu.

+0

Sqoop не работает с хранилищем данных Azure SQL. Причина в том, что Sqoop пытается установить уровень изоляции транзакции своего картографа при попытке прочитать/записать в/из Azure SQL Data Warehouse в READ COMMITTED, который не поддерживается в Azure SQL Data Warehouse и, таким образом, дает ошибку. –