Я пытаюсь загрузить каталог паркетных файлов в искре, но не могу показаться, чтобы заставить его работать ... это похоже на работу:Как использовать sqlContext для загрузки нескольких паркетных файлов?
val df = sqlContext.load("hdfs://nameservice1/data/rtl/events/stream/loaddate=20151102")
, но это не работает:
val df = sqlContext.load("hdfs://nameservice1/data/rtl/events/stream/loaddate=201511*")
он возвращает мне эту ошибку:
java.io.FileNotFoundException: File does not exist: hdfs://nameservice1/data/rtl/events/stream/loaddate=201511*
как я заставить его работать с дикой картой?
Вы можете использовать одно из решений в http://stackoverflow.com/questions/794381/how-to-find-files-that-match-a-wildcard-string- in-java, чтобы превратить шаблон в список имен файлов, существующих в вашей системе. –
Какая версия Spark? Это должно быть исправлено .. –