2016-11-15 7 views
0

У кого-нибудь есть опыт с подобной ошибкой? Я вижу эту ошибку при выполнении заданий искра 2.0.1, используя S3A протокол.WARN TaskSetManager: Потерянная задача com.amazonaws.AmazonClientException: не удалось отменить ответ (не удалось разобрать XML-документ с обработчиком

Я также видел спорадические неудачи saveAsTextFile на s3. Я думаю, что это по крайней мере, иногда восстанавливается.

Пытаясь найти направление, если это реализация pyspark или S3A свойства, пределы, таймауты , или что-то еще.

спасибо!

ответ

0

Проблема заключалась в том, что после запуска искровых работ почти год мы накопили много файлов под одним и тем же способом S3. Проблема S3 была проблемой. Все, что я сделал, это изменить верхний уровень «subdir», поэтому пути к новым файлам были разными, а производительность значительно улучшилась.

0

Приятно послушать это исправление.

Если вы видите его снова, можете ли вы добавить трассировку стека в JIRA при проблемах apache org, проекте HADOOP, компоненте fs/s3? Это может показать нам, где мы можем сделать немного больше логики повторения при неудачных операциях.

Смежные вопросы