Я работал с Azure Data Lake Store, и в документации Microsoft утверждает, что система оптимизирована для небольших записей в файлах с малой задержкой. Протестировав это, я попытался выполнить большой объем операций записи в параллельных задачах в один файл, но этот метод в большинстве случаев возвращает неверный запрос. Эта ссылка https://issues.apache.org/jira/secure/attachment/12445209/appendDesign3.pdf показывает, что HDFS не предназначен для обработки параллельных добавлений в одном файле, поэтому я повторил второй раз с помощью метода ConcurrentAppendAsync, найденного в API, но хотя этот метод не разбился, мой файл никогда не изменялся в хранилище ,Azure Data Lake Store параллелизм
2
A
ответ
2
Что вы выяснили, правильно, как работают параллельные записи. Я предполагаю, что вы уже прочитали documentation ConcurrentAppendAsync.
Итак, в вашем случае, вы использовали тот же файл для теста записи Webhdfs и ConcurrentAppendAsync? Если это так, то ConcurrentAppendAsync не будет работать, как указано в документации. Но в этом случае вы должны получить ошибку.
В любом случае, сообщите нам, что произошло, и мы можем исследовать дальше.
Спасибо,
Сэчин Sheth
Руководитель программы - Лазурное озеро данных
Смежные вопросы
- 1. Консистенция Azure Data Lake Store
- 2. Powershell -recursive in Azure Data Lake Store
- 3. Azure Data Lake: запрос в Azure Data Lake Store был несанкционирован
- 4. Как скопировать azure blob-файлы в azure data lake analyticis
- 5. Azure Data Lake Analytics IOutputter E_RUNTIME_USER_ROWTOOBIG
- 6. Ограничение памяти в Azure Data Lake Analytics
- 7. E_RUNTIME_SYSTEM_ERROR на Azure Data Lake Analytics
- 8. Как использовать Azure Data Lake Store в качестве набора входных данных для Azure ML?
- 9. Тайм-аут авторизации: Конфигурация магазина Azure Data Lake в Factory Azure Data
- 10. Интеграция Azure CDN с магазином Azure Data Lake
- 11. Где хранятся базы данных Azure Data Lake Analytics?
- 12. Полибаза и предикат Pushdown на Azure Data Lake Analytis
- 13. Hadoop Vs Data Lake
- 14. Как читать файл, присутствующий в Azure Data Lake Store, через лазурные команды командной оболочки?
- 15. HDInsight Spark cluster - не удается подключиться к Azure Data Lake Store
- 16. Azure Lake Data Store «Маркер доступа не предусмотрено в заголовке„авторизации“» с помощью HttpClient
- 17. Azure Lake Data Analytics IOutputter получить имя выходного файла
- 18. Заголовок авторизации для WebHDFS с Azure Data Lake
- 19. Источник данных источника питания BI BI Azure Data lake
- 20. PowerBI.com Dataset Refresh for Azure Data Lake с OAuth2
- 21. Как запланировать запрос U-SQL в Azure Data Lake?
- 22. U-SQL (Azure Data Lake языка) ошибка сценария
- 23. Оптимизация для максимальной степени параллелизма в Azure Data Lake
- 24. Azure Data Lake Внешние источники данных: размер строки слишком большой
- 25. Google BigQuery vs Azure data lake U-SQL
- 26. Как добавить дату и время в имя файла, который публикуется на фабрике Azure Data Lake Store by Data?
- 27. Политика хранения данных в Data Lake
- 28. Azure Data Lake Store: запрос был несанкционирован при записи в ADLS с фабрики данных в другой подписке
- 29. Не удалось предоставить доступ к файлам хранилища данных Azure Data Lake из кластера HDInsight
- 30. Подключить концентраторы событий Azure с хранилищем данных Lake
Я не знаю, что я делаю неправильно, но ConcurrentAppendAsync ничего не добавляет к моему файлу, но это не подводит – evilpilaf
Можете ли вы связаться со мной по электронной почте - sachinsatmicrosoftdotcom? Хотелось бы посмотреть, что происходит в деталях. Благодарю. –
Ссылка не работает, можете ли вы предоставить обновленную версию? – aoetalks