2014-02-15 3 views
0

Я программист на Linux. Я использовал для написания кода, чтобы все было сделано: java perl php c. Мне нужно начать работу с DATA STAGE.Возможности DATASTAGE

Все, что я вижу, это то, что DATA STAGE работает с данными стиля таблицы/csv и делает это по строкам.

Я хочу знать, может ли DATA STAGE работать с файлом, который не является таблицей/csv. может ли он загружать данные в структуры данных и запускать на них функцию или ограничивается только работой только по одной строке за раз.

спасибо за любую информацию, которую вы можете дать на возможности DATA SATGE

ответ

0

IBM (ранее Ascential) DataStage является платформой ETL, что, действительно, работает на наборах данных, применяя различные преобразования.

Это не обязательно означает, что вы ограничены применением только однострочных преобразований (вы также можете агрегировать, объединить, разделить и т. Д.). Кроме того, у DataStage есть собственный язык программирования - BASIC - который позволяет вам изменять дизайн ваших заданий по мере необходимости.

Наконец, вы по-прежнему можете вызывать внешние скрипты из DataStage (используя функцию DSExecute, свойство Before Job, свойство After Job или Command stage).

Для получения полной документации по базовому программированию, пожалуйста, проверьте IBM Information Center.

Вы также можете проверить форумы DSXchange для конкретных тем DataStage.

0

Да, он может, так как Разван сказал, что вы можете присоединиться, заполнить, расколоть. Он может использовать циклы и внешние скрипты, он также может обрабатывать XML. Мой совет для вас в том, что если у вас есть большое количество данных, которые вам нужно будет работать, тогда datastage - ваш друг, иначе если данные, которые вам придется загружать, не очень большие, тогда это будет проще использовать JAVA, c или любой язык программирования, который вам известен.

0

Вы можете в любое время выполнять функции, конвертировать, манипулировать данными. в основном Datastage используется для удобства использования, когда вы обрабатываете огромные данные из datamart/datawarehouse.

Основным процессом сбора данных будет ETL - загрузка трансформации извлечения. Если программист использует 100 строк кода для подключения к какой-либо базе данных, мы можем сделать это одним щелчком мыши. Все, что можно сделать здесь, даже c, C++-кодирование в активности rountine.

Смежные вопросы