Я пытаюсь записать временные файлы для рабочих, выполняющих задания Dataflow, но кажется, что файлы удаляются во время выполнения задания. Если я вхожу в SSH в запущенную виртуальную машину, я могу выполнить ту же самую команду генерации файлов, и файлы не будут уничтожены - возможно, это очистка, которая выполняется только для пользователя-бегуна потока данных. Возможно ли использовать временные файлы или это ограничение платформы?Временные файлы в облачном потоке Google
В частности, я пытаюсь написать на адрес, указанный Files.createTempDir()
, что составляет /tmp/someidentifier
.
Edit: Не уверен, что происходит, когда я отправил, но Files.createTempDirectory()
работы ...
Я использую 'MapElements.via (новый MySimpleFunction())', см. [Здесь] (https://gist.github.com/zbjornson/ac6a378129f1675ca5ff?ts=4) - если ваш второй абзац применим для этого режима ? Когда я использую 'Files.createTempDir()' (который дает что-то под/tmp), каталог и/или его содержимое мгновенно исчезают. Я действительно использую GCS для постоянного хранения (ввода и вывода). Спасибо - – ZachB
Да. Файл, созданный в/tmp, созданный внутри вызова Processor.apply, должен оставаться видимым во время этого вызова. Что заставляет вас думать, что файл удаляется? Вы уверены, что создали его в первую очередь? Вы не проверяете результат mkdirs. Возможно ли, что mkdirs не удалось? –