Я пытаюсь понять разницу или «за» и «против» между большим запросом Google и данными Azure Lake U-SQL. Что лучше ? Я исчерпывающе искал то, что большая разница, но не смог найти его.Google BigQuery vs Azure data lake U-SQL
ответ
Хорошо, вот некоторые фундаментальные различия между обеими технологиями.
Форма данных
- Google большой запрос - они просят вас, чтобы превратить ваши данные в определенные формы, как JSON, CSV или Avro.
- Данные озера - они просто просят вас сбросить все, что у вас есть, в магазине озера, и вы можете запускать запросы usql сверху.
Размер данных
Google большой запрос имеет ограничения по сравнению с размером файла - https://cloud.google.com/bigquery/loading-data-into-bigquery#quota, хотя они довольно большие ограничения
озеро данных - не имеет официально никаких ограничений по сравнению с размером файла, вы может практически начинаться с файла Petabyte.
Самое большое различие между моделью запроса, но перед этим нужно знать, что вы также можете запускать рабочие нагрузки HBase поверх хранилища данных Azure data, а HBase - это реализация Google большого стола с открытым исходным кодом, многие другие тонкие Вы можете увидеть здесь http://www.larsgeorge.com/2009/11/hbase-vs-bigtable-comparison.html.
Большой запрос Google не является компилируемым запросом как таковым, в то время как USQL представляет собой комбинацию синтаксиса SQL с возможностями CLR, запросы USQL сначала компилируются, а затем запускаются через хранилище данных, что позволяет писать пользовательские функции для использования с их запросами для анализа или работы с формами данных diff. Можно даже визуализировать план выполнения USQL-запроса, используя инструменты Azure data lake. И большой запрос, и USQL довольно легко понять и работать.
Authentication
- Google большой запрос имеет стандартную проверку подлинности API https://cloud.google.com/bigquery/authentication
- ADL - Аутентификация приложений и пользователей контролируется Azure AD.
Как большая платформа данных, они требуют уважения, но я лично считаю озеро Azure Data более надежным, поскольку он позволяет гибко работать с проектами с открытым исходным кодом, такими как искра, шторм, улей, свинья и т. Д., В то время как большие таблица ограничивает ваши возможности только экосистемой google.
Connect со мной в моей щебет ручки @brijrajsingh, и если вы можете сделать это делать заскочить в ГИД Бангалоре, я доставку сессии о озерам данных по 29 апреля, 2016
- 1. Hadoop Vs Data Lake
- 2. Консистенция Azure Data Lake Store
- 3. Azure Data Lake Store параллелизм
- 4. Обновление в озере USQL Azure Data
- 5. Azure Data Lake: запрос в Azure Data Lake Store был несанкционирован
- 6. Azure Data Lake Analytics IOutputter E_RUNTIME_USER_ROWTOOBIG
- 7. Ограничение памяти в Azure Data Lake Analytics
- 8. E_RUNTIME_SYSTEM_ERROR на Azure Data Lake Analytics
- 9. Powershell -recursive in Azure Data Lake Store
- 10. Azure Data Factorys vs SSIS
- 11. Интеграция Azure CDN с магазином Azure Data Lake
- 12. Как скопировать azure blob-файлы в azure data lake analyticis
- 13. Vertex повторил слишком много раз ошибка произошла при запуске Azure data lake analytic job
- 14. Azure Lake Data Analytics IOutputter получить имя выходного файла
- 15. Заголовок авторизации для WebHDFS с Azure Data Lake
- 16. Источник данных источника питания BI BI Azure Data lake
- 17. PowerBI.com Dataset Refresh for Azure Data Lake с OAuth2
- 18. Как запланировать запрос U-SQL в Azure Data Lake?
- 19. Полибаза и предикат Pushdown на Azure Data Lake Analytis
- 20. Где хранятся базы данных Azure Data Lake Analytics?
- 21. U-SQL (Azure Data Lake языка) ошибка сценария
- 22. Оптимизация для максимальной степени параллелизма в Azure Data Lake
- 23. Azure Data Lake Внешние источники данных: размер строки слишком большой
- 24. Тайм-аут авторизации: Конфигурация магазина Azure Data Lake в Factory Azure Data
- 25. Создайте сборку USQL из DLL в хранилище Azure Blob
- 26. Политика хранения данных в Data Lake
- 27. Azure WebJobs Vs DataFactory
- 28. Google BigQuery Streaming Data не соответствует Mixpanel
- 29. Как использовать Azure Data Lake Store в качестве набора входных данных для Azure ML?
- 30. Bigquery Shard Vs Bigquery Partition
AFAIK вы не можете запустить USQL запрос на Паркетные файлы еще (официально не поддерживаются). – chhantyal