Я хочу знать, какие типы файлов используются для загрузки данных в Apache Spark, например (CSV, TXT и т.д.)какие типы файлов, используемых для потоковой передачи в Apache Spark
-3
A
ответ
0
fileStream
может принимать любой тип файла поскольку вы можете предоставить класс входного формата, который может преобразовать его в записи. Чтобы быть полезным, вход должен быть расщепляемым и легко разобрать без чтения целого файла, но он не должен иметь до тех пор, пока вы можете принять штраф за производительность.
Смежные вопросы
- 1. Spark Частота потоковой передачи
- 2. Использование Apache Flink для потоковой передачи данных
- 3. Лучший способ для потоковой передачи PDF-файлов
- 4. Apache обратный прокси для потоковой передачи видео
- 5. ID3v2 библиотека для потоковой передачи mp3-файлов?
- 6. Как использовать JavaScript для потоковой передачи файлов?
- 7. Комбинация контекста Spark и контекста потоковой передачи
- 8. Для потоковой передачи или не для потоковой передачи
- 9. Spark SQL: структура потоковой передачи с опцией подписчика Kafka
- 10. Лучший способ для потоковой передачи файлов в ASP.NET
- 11. Решения для потоковой передачи видео
- 12. проблема потоковой передачи файлов f4v с jwplayer
- 13. Ошибка в Spark Код потоковой передачи в scala
- 14. Rails3 генерации и потоковой передачи больших файлов
- 15. Тестирование потоковой передачи файлов с помощью селена?
- 16. Типы символов, используемых в PYTHON
- 17. Объединить результаты пакетной RDD с потоковой RDD в Apache Spark
- 18. Какие типы файлов поддерживает X509Certificate2?
- 19. Какие типы файлов поддерживаются для отображения RichTextBox?
- 20. Какие типы файлов применяется для canwrite() Java?
- 21. eclipse eGit - какие типы файлов для фиксации?
- 22. Какие типы файлов поддерживает MarkLogic?
- 23. Какие типы файлов поддерживает GitHub для README's
- 24. API для потоковой передачи звука
- 25. Альтернатива subprocess.Popen.communicate() для потоковой передачи
- 26. Шаблон проектирования для потоковой передачи
- 27. Усиление производительности для потоковой передачи
- 28. Java-сервлетов для потоковой передачи
- 29. тестирование python для потоковой передачи
- 30. Какие типы файлов поддерживаются WKWebView?
Кстати, тег Hadoop на самом деле не нужен, поскольку Spark может работать без HDFS и YARN –