Я создал вектор признаков (data.frame), который имеет идентификатор, feat1, feat2, feat3, логический, но в этом кадре данных имеются дубликаты идентификаторов, что делается целенаправленно. То, что я хочу сделать, - это то, что я перебираю этот кадр данных, создавая новый фрейм данных для каждого идентификатора.R Создать новый фрейм данных для каждого уникального идентификатора
Для простоты предположим, я следующие два столбца.
X1 X2 X3
1 000000001 -1.4061361 1
2 000000001 -0.1973846 1
3 000000002 -0.4385071 1
4 000000001 -0.6593677 0
5 000000001 -1.2592415 0
6 000000001 -0.5463655 1
7 000000002 0.4231117 0
8 000000002 -0.1640883 1
9 000000002 0.7157506 0
10 000000002 2.3234110 1
Я хочу построить другую рамку данных на основе X1 в основном я хочу, чтобы получить все же X1 в свои собственные кадры данных. Я написал несколько циклов для циклов, но это занимает очень много времени, так как это большой набор данных. Каков наилучший способ сделать это?
Использование 'split' с X1 –
Обратите внимание, что при создании всех этих копий будет, по крайней мере, вдвое больше использования вашей памяти. Поэтому, если вы планируете провести анализ на каждом фрагменте и сохранить только небольшой набор итоговых результатов, проверьте функцию 'by()'. –
@ Ferdinand.kraft Да, я планирую сделать анализ инфантной причины. Я делаю это. Я хочу запускать randomforest на каждом, поэтому я действительно беспокоился о потреблении памяти. Как вы предлагаете мне использовать это дело? –