Я работаю над текстовым анализом 20 наборов данных Newsgroups, а часть его основывается на классификации различных статей на основе слов в указанных статьях. То, что я в настоящее время смог сделать, - разобрать отдельную статью, а затем скомпилировать статистику об этом. Я могу сделать это индивидуально в каждой статье, но объединение статей кажется моим падением.Объединение фреймов данных в R-текстовом анализе
Что я ищу, чтобы быть в состоянии сделать, в R состоит в следующем:
Возьмите два (в идеале любое число) dataframes частоты проанализированных и вытекают слова, и объединить их вместе, чтобы показать частота слов в обеих статьях как один фрейм данных. Я хотел бы иметь возможность сделать это без объединения статей в один более крупный документ.
Возьмите эту dataframe и сортировать его по верхней частоте, отображает только верхнюю 50.
Любая помощь будет принята с благодарностью!
Я думаю, что вы ищете 'merge'. –