У меня есть кусок предложений, и я хочу построить список неориентированных краев совместного совпадения слов и увидеть частоту каждого ребра. Я взглянул на пакет tm
, но не нашел подобных функций. Есть ли какой-нибудь пакет/сценарий, который я могу использовать? Большое спасибо!Строка списка совпадений со словом в R
Примечание: Слово не происходит совместно с самим собой. Слово, которое появляется дважды или более, происходит с другими словами только один раз в том же предложении.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
ВЫВОД
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1
@TylerRinker спасибо! Точно выход должен оставаться таким же, как и строка 5 имеет только «а», а в строке 6 «а» не происходит совместно с собой. – leoce