2012-04-25 4 views
3

Я новичок в Amazon Services и попытался запустить приложение в Amazon EMR.Как увидеть выход в Amazon EMR/S3?

Для этого я следовал шаги, как:

1) Создан Сценарий Hive, который содержит -> создать таблицу, о данных нагрузки в улье с некоторым файлом и выберите * из команды.

2) Создано ведро S3. И я загружаю в него объект как: Hive Script, File для загрузки в таблицу.

3) Затем создан рабочий поток (с использованием программы Sample Hive Program). С учетом ввода, вывода и сценария (например, s3n: //bucketname/script.q, s3n: //bucketname/input.txt, s3n: // bucketname/out /). Не создал каталог. Я думаю, что он будет создан автоматически.

4) Затем начнется запуск потока работ, и через некоторое время я увижу состояния, как STARTING, BOOTSTRAPING, RUNNING и SHUT DOWN.

5) При запуске состояния SHUT DOWN оно автоматически прекращается, показывая состояние FAILES для SHUT DOWN.

Тогда на S3 я не видел каталог. Как увидеть результат? Я видел каталог как демоны, узлы и т. Д.

А также как посмотреть данные из HDFS в Amazon EMR?

+0

У меня была такая же проблема; довольно болезненно после огромной работы. К сожалению, я разрешил работу автоматически завершить работу после завершения. Вы могли отслеживать свои данные и/или причину, по которым это не удалось? –

ответ

2

Выходной путь, указанный в пункте 3, должен содержать результаты (Из вашего описания, это S3N: // bucketname/из /)

Если это не так, что-то пошло не так с вашим Улем сценарием , Если ваше задание Hive не удалось, вы найдете информацию об ошибке/исключении в журнале jobtracker. Журнал поиска работы существует под <s3 log location>/daemons/<master instance name>/hadoop-hadoop-jobtracker-<some Amazon internal IP>.log

Только один файл в вашей директории журналов будет иметь ключ S3 в вышеуказанном формате. Этот файл будет содержать любые исключения, которые могли произойти. Вероятно, вы хотите сосредоточиться на нижнем конце файла.

Смежные вопросы