У меня есть эта задача. В статье журнала рассматриваются различные темы. Мы присваиваем числовое значение, чтобы отразить силу отношений (ссылки) между конкретной темой и статьей. Переформатируйте необработанные данные в более удобную презентацию следующим образом.Использование awk или другой команды для объединения и обработки дубликатов
INPUT DATA (tab-separated)
Theme Article Link_strength
A aaa 2
A bbb 8
B bbb 7
C aaa 3
OUTPUT DATA
Article Theme_A Theme_B Theme_C
aaa 2 0 3
bbb 8 7 0
Я попытался R, но размер данных является проблемой Таким образом, мне нужно выяснял команда AWK может помочь. Но как это сделать?
есть ли еще темы или статьи? – philshem
Как размер данных является проблемой для R, но awk больше подходит? – beroe