Я получаю ошибку в моих искровых работах, и они, как правило, похожи на приведенные ниже. У узла в кластере около 256 ГБ памяти и около 8 ядер, также я указал память исполнителей как 4 ГБ и дополнительные 4 ГБ накладных расходов. Для тасования я определил долю памяти как 0.5, все это я хочу указать, что это не похоже на проблему с памятью. Однако я не могу понять, что может быть проблемой, и это происходит в той или иной степени, я неоднократно повторял свою работу, и это происходит в нескольких точках. Вы можете предположить, что у нас есть инфраструктура около 200 + узлов с достойной конфигурацией.Spark Yarn/tmp Нет такого файла или каталога
Работа отменена из-за отказа этапа: Задача 0 на этапе 2.0 не удалась 12 раз, последний сбой: Потерянная задача 0,11 на этапе 2.0 (TID 27, lgpbd1107.sgp.ladr.com): java.io.FileNotFoundException:/tmp/hadoop-mapr/nm-local-dir/usercache/names/appcache/application_1485048538020_113554/3577094671485456431296_lock (Нет такого файла или каталога)
Я не могу понять, связана ли его проблема с приложением или инфраструктурой. Может кто-то помочь.
Можете ли вы подробнее, я прочитал провел свою работу около 10 раз в разные промежутки времени и получили подобную ошибку. Работа начинается и не выполняется в течение 20 минут, я предполагаю, что 20 минут недостаточно велики, в течение которых tmp watch удалит файлы. – user500377