Я хотел бы знать, как использовать R для объединения строк в один набор данных.R - объединение/объединение строк в одном наборе данных
В настоящее время мои данные выглядит следующим образом:
Text 1 Text 2 Text 3 Text 4
Bob Aba Abb Abc
Robert Aba Abb Abc
Fred Abd Abe Abf
Martin Abg Abh Abi
Если текст два и текст 3 являются одинаковыми для двух строк (как в строках 1 & 2) Я хотел бы сделать это в один ряд с более столбцы для других данных.
Text 1 Text 1a Text 2 Text 3 Text 4 Text 4a
Bob Robert Aba Abb Abc Abd
Fred NA Abd Abe Abf NA
Martin NA Abg Abh Abi NA
я сделал что-то подобное с соединением двух отдельных наборов данных и объединение их с помощью присоединиться
join=join(Data1, Data2, by = c('Text2'), type = "full", match = "all")
, но я не могу работать, как это сделать дубликаты в пределах одного набора данных.
Я думаю, что можно было бы использовать агрегат, но я не использовал его раньше, моя попытка была:
MyDataAgg=aggregate(MyData, by=list(MyData$Text1), c)
, но когда я пытаюсь я получаю вывод, который выглядит следующим образом на резюме:
1 -none- numeric
1 -none- numeric
2 -none- numeric
или это по структуре:
$ Initials :List of 12505
..$ 1 : int 62
..$ 2 : int 310
..$ 3 : int 504
Я хотел бы также, чтобы иметь возможность объединить ряд используя совпадающие элементы двух переменных.
Не могли бы Вы предоставить еще несколько деталей? Сколько столбцов вам нужно будет дублировать, только «Text1» и «Text4»? Ожидаете ли вы, что более двух копий каждой пары ID (количество потенциальных столбцов всего в два раза больше)? – ilir
Почти во всех случаях было бы только две строки одинаковые - так да вдвое больше столбцов. Я не беспокоюсь о потере нечетного количества данных в маловероятном случае, если три строки одинаковы. Но это должно было бы не сломаться, если бы это произошло, поэтому я не мог этого сделать, сортируя данные и полагаясь на согласованность каждой другой записи. Есть также намного больше переменных, чем в моем примере. – Wol44