0

Я хочу использовать локальные текстовые файлы в моей программе Spark, которую я запускаю в HDP 2.5 Sandbox в VMWare.Могу ли я импортировать файл с локального диска в VMWare HDP 2.5 Sandbox для использования в Spark через Zeppelin?

1) Есть ли способ перетаскивания, чтобы напрямую получить его в HDFS VM?

2) Могу ли я импортировать его с помощью Zeppelin? Если да, то как получить абсолютный путь (местоположение), чтобы использовать его в Spark?

3) Любой другой способ? Что и как, если да?

+0

Чтобы получить файлы с вашего хоста на виртуальную машину, вам необходимо использовать SCP или (S) FTP –

ответ

0

Чтобы получить данные в HDFS в вашей виртуальной машине, вам необходимо будет использовать команду hdfs для перемещения файлов из локальной файловой системы в вашей виртуальной машине в HDFS в виртуальной машине. Команда должна выглядеть примерно так:

hadoop fs -put filename.log /my/hdfs/path 

Для получения дополнительной информации о HDFS команды, пожалуйста, обратитесь к Hadoop File System Shell Commands.

Если вы используете Apache Spark, вы также можете обратиться к локальной файловой системе вместо HDFS. Для этого вы должны использовать file:///... вместо hdfs://.... Например, чтобы получить доступ к файлу в HDFS с помощью искры, как правило, можно выполнить команду, как:

val mobiletxt = sc.textFile("/data/filename.txt") 

, но вы также можете получить доступ к локальной файловой системе ВМ как:

val mobiletxt = sc.textFile("file:///home/user/data/filename.txt") 

Что касается Apache Цеппелина , это интерфейс ноутбука для работы с Apache Spark (и другими системами); там ток не является механизмом импорта внутри самого Zeppelin. Вместо этого вы будете делать что-то вроде выше в своем ноутбуке для доступа к HDFS или локальной файловой системе VM.

+0

Хорошо, спасибо, но как я могу импортировать файл с рабочего стола в локальную файловую систему виртуальной машины? –

+0

Если вы используете VirtualBox, вы можете указать: https://www.liberiangeek.net/2013/09/copy-paste-virtualbox-host-guest-machines/. Если вы используете VMWare, вы можете указать: https://www.vmware.com/support/ws5/doc/ws_running_dragndrop.html. НТН! –

Смежные вопросы