Мне предоставлен файл с сотнями тысяч значений, непоследовательно отформатированный в файле .CSV. Структура может выглядеть следующим образом:Возврат списка подсчитанных, уникальных элементов
А, В, С, D
Е, F
G, H, I, J, К, L, М, N, О
Р, Q, R, S
И так далее.
Все, что мне нужно сделать, это: а) перечислить уникальные значения и b) подсчитать их одинаковые. Приятно делать это в R, Excel или любом другом рекомендованном инструменте.
Обычно я использую что-то вроде функций Google Docs '= UNIQUE и = COUNT, но таблица слишком велика для загрузки там. И я не нашел точных эквивалентов в Excel, как ни странно.
Любая помощь приветствуется.
Благословите вас, которые работали как чемпион! Написал его в .csv, используя write.csv(), и я отправился на гонки. Большое спасибо! – sogrady