Недавно я получил некоторое время, чтобы изучить визуализацию данных, как своего рода замену диаграммы Excel. Мой выбор R (с ggplot2) и начал его изучать.Язык программирования для обработки больших данных для R
В «R в двух словах», Джозеф Адлер положил, что:
Как правило, я использую инструмент, как Perl для предварительной обработки больших файлов перед их использованием в R.
Я предлагаю используя язык сценариев, такой как Perl, Python или Ruby, до препроцессор больших, сложных текстовых файлов и превратить их в удобоваримую форму . (В качестве примечания, я обычно выписываю списки имен полей и длины в Excel, а затем использовать формулы Excel для создания R или Perl кода, чтобы загрузить их.
Идея лежит за это философия Unix . --let каждый инструмент делать свою работу хорошо, и пусть они работают вместе Таким образом, в конечном счете, я планирую учиться:
- R для visulization и
- другого языка программирования для данных обработки данных в будущее.
Вопрос возникает, какой язык изучать?
У меня нет фона для компьютерных наук, между тем Perl слишком сложно для меня. Я сделал поиск в Интернете, обнаружил, что Haskell и Clojure довольно интересны. Поскольку здесь есть много программистов + статистиков, я хотел бы знать, какой из них служит большой целью обработки данных, хорошо сочетается с R?
Ник
с отсутствующим фоном haskell CS/закрытие будет diffuclt для освоения. Я рекомендую python. – Nishanth
На самом деле это не место для такого рода вопросов, так как оно немного открыто. Пожалуйста, прочитайте [** эту часть FAQ **] (http://stackoverflow.com/faq#dontask). Вы могли бы попросить об этом в [чате вместо?] (Http://chat.stackoverflow.com/rooms/25312/r-public) –
@ e4e5f4 Идея о том, что Clojure трудно освоить без CS-фона, является странной , Я не вижу каких-либо очевидных препятствий, не присутствующих на Python, если вы не считаете, что у не-программистов есть более легкое время с двоеточиями и правильными правилами отступов, чем с круглыми скобками. – Chuck