В SAS при создании набора данных SAS из файла необработанных данных (csv) мы можем либо использовать шаг DATA
с ключевым словом infile
, либо с шагом PROC IMPORT
. Каковы преимущества и недостатки каждого из них?Используйте шаг DATA и PROC IMPORT
ответ
Proc Import делает предположения о длинах символьных переменных и типов переменных на основе чтения ряда строк в CSV, который контролируется опцией. Если вы выдаете команду отзыва в интерактивном режиме после запуска proc import, вы получаете код шага данных, который proc импортирует, сгенерированный для выполнения фактической работы. Он генерирует инструкции формата и информации, которые могут или не могут быть точно такими, какие вы хотите.
Я часто использую импорт proc в качестве генератора кода шага данных, вызываю код и затем изменяю его в соответствии с тем, что я хочу.
Вы также можете добавить другую логику обработки, чтобы расширить функциональность шага за пределы простого чтения исходных данных в набор данных. Создание новых переменных в качестве трансформаций одного или нескольких столбцов в CSV возникает.
Я вообще согласен, что это слишком широкий вопрос. Тем не менее:
PROC IMPORT медленнее, чем ШАГ ДАННЫХ. Это связано с тем, что PROC IMPORT смотрит на файл, а затем записывает и выполняет ШАГ ДАННЫХ.
DATA STEP требует, чтобы вы знали имя, положение и атрибуты (тип, длина и т. Д.) Для каждой переменной.
Если мне нужно прочитать файл один раз, я просто использую PROC IMPORT.
Если мне нужно прочитать файл несколько раз, мне не нужна скорость, и формат файла может измениться, а затем я использую PROC IMPORT.
Если я в производственной системе, где скорость имеет значение, и я хочу ОШИБКУ, если формат изменяется, то я использую PROC IMPORT. Но я беру ШАГ DATA, который он пишет для меня, и помещал это в мой код.
Если PROC IMPORT неверно угадывает мои столбцы, я использую PROC IMPORT, изменяю ШАГ DATA, который он производит, и затем используйте это.
- 1. SAS PROC Import vs DATA шаг с INFILE
- 2. SAS PROC Transpose Data
- 3. Как интерпретировать данные, прочитанные impt matplotlib?
- 4. Преобразование Proc Sql Существует запрос к данным Шаг
- 5. SAS Data Шаг: Объединить строки в переменную на лету
- 6. Формат и формат Proc SAS
- 7. SAS: DATA STEP против PROC SQL
- 8. SAS: proc Сводка и proc Сортировка
- 9. cassandra data model шаг за шагом
- 10. caffe data layer пример шаг за шагом
- 11. Используйте jQuery. data() с выбором
- 12. Семантических регистраций In-Proc и из-Proc
- 13. Spring Data Store Redis - используйте несколько кешей
- 14. Используйте findByOrganizerId в запросе spring-data-jpa
- 15. Proc Export и Proc Импорт XLSX в WPS/SAS
- 16. lpc1788 ssp (SPI) - proc proc proc
- 17. SQL Reporting Используйте хранимую процедуру proc или query/view
- 18. Шаг данных внутри макрофункции
- 19. C++ COM out-of-proc marshalling data через proxy \ stub
- 20. PHP и mysql proc
- 21. regsub -all и proc
- 22. Сжатие/sys и/proc
- 23. Имена Лямбда и proc
- 24. SAS и proc sql
- 25. Proc Data set аргумент error- Ошибка 22-322, ожидающая имени
- 26. Proc Tabulate не выполняет заказ order = data option
- 27. Proc Формат/Proc ошибка Tabulate
- 28. CI Runner - используйте G ++ 4.8 для npm шаг установки
- 29. Используйте опцию «шаг» в Highcharts, начиная с конца xaxis
- 30. MATLAB Матричный шаг шаг
Списки преимуществ/недостатков на самом деле не по теме для этого сайта («вопросы списка»). Я думаю, что более подходящий вопрос будет по теме. – Joe
В частности, если вы ищете что-то конкретное об одном _or_ другом, спрашиваете, что может быть по теме. Сейчас он слишком широк и слишком ориентирован на обсуждение. Хороший вопрос должен исходить из конкретного варианта использования или, по крайней мере, более или менее конкретного варианта использования; так что вопрос с некоторыми подробностями о потенциальном прецеденте был бы уместным. – Joe
Также см. [Этот мета-вопрос] (http://meta.stackoverflow.com/questions/258308/asking-questions-about-advantages-disadvantages-onsoso) для более подробной информации. – Joe