я наткнулся мини-учебника для данных предварительной обработки с помощью искры здесь: http://ampcamp.berkeley.edu/big-data-mini-course/featurization.htmlКак читать XML-файлы из фреймворка apache?
Однако это обсуждается только Textfile разбора. Есть ли способ разбора xml-файлов из искровой системы?
я просто редактировал этот ответ. Извините за мое плохое и, пожалуйста, извините это (на самом деле это был мой самый первый ответ). –