У меня есть настроенная раковина, расширяющаяся FileBasedSink
, к которой я пишу, вызывая PCollection.apply(Write.to(MySink))
в потоке данных (очень просто до XmlSink.java). Однако кажется, что по умолчанию просто вызов Write.to
всегда приведет к 3 выводам? Есть ли способ, которым я мог бы определить количество выходных осколков (например, TextTO.Write.withNumShards
) только в настройках класса класса? или я должен определить другой настроенный PTransformer
как TextIO.Write
?Установить количество осколков вывода в Write.to (Sink) в потоке данных
1
A
ответ
0
К сожалению, прямо сейчас FileBasedSink
не поддерживает указание количества осколков.
На практике количество полученных вами осколков будет зависеть от того, как инфраструктура выбирает для оптимизации частей трубопровода, производящего коллекцию, которую вы пишете, поэтому по существу нет контроля над этим.
Я подал a JIRA issue по вашему запросу, чтобы вы могли подписаться на статус.
Смежные вопросы
- 1. Количество осколков в Solr
- 2. Уменьшить количество осколков в ElasticSearch
- 3. Как установить количество потоков в потоке Quartz.NET?
- 4. найти нужное количество осколков в elasticsearch
- 5. Увеличьте количество осколков в DynamoDB, чтобы развернуть больше lambdas параллельно
- 6. Тип вывода в потоке
- 7. R sink() в базу данных
- 8. с использованием `?:` В потоке вывода
- 9. Как определить количество осколков на ElasticSearch?
- 10. Изменить количество Elasticsearch осколков по умолчанию
- 11. Какое максимальное количество осколков может иметь MongoDB?
- 12. Как определить общее количество ключей раздела в потоке AWS kinesis?
- 13. Как установить максимальное количество редукторов на узел в потоке Hadoop?
- 14. Elasticsearch: несогласованное количество осколков в статистических и кластерных API
- 15. Функция Sink в R
- 16. Как установить Spring Source и Sink
- 17. Использование рабочих в пользовательских Sink
- 18. Несколько файлов в потоке ввода-вывода java
- 19. вопрос о блокировании ввода/вывода в потоке
- 20. Визуализация вывода сверточного слоя в тензорном потоке
- 21. Максимальное количество параллельных заданий в облачном потоке данных
- 22. Как я могу увидеть количество строк, обработанных в потоке данных?
- 23. ElasticSearch: Как отключить перераспределение осколков всех осколков?
- 24. Установить PictureBox изображение в потоке
- 25. Сколько осколков в Google App Engine оштрафовано?
- 26. определить количество символов, напечатанных в выходном потоке в java
- 27. Elasticsearch калибровка осколков
- 28. Обновление осколков экрана в ViewPager
- 29. Найти количество AP триплетов в потоке чисел
- 30. javaCC Количество вызовов функции в потоке файла
thanks jkff, ahh хочу прояснить себе, все ли настроенные раковины не способны поддерживать контроль над количеством осколков вывода? и, по вашему мнению, каков наилучший маршрут в настоящий момент, чтобы обеспечить гибкое количество осколков вывода с моей настроенной раковиной? –
Я думаю, что единственный способ достичь этого в настоящее время - без пользовательского API-интерфейса: подключить ваши данные через ParDo {hash the data modulo numShards} | GBK | ParDo {записать данные этого осколка во временный файл; в finishBundle, атомно переименуйте его в конечное местоположение}. – jkff
Но обратите внимание, что это также не будет работать во многих службах из-за динамического изменения работы –