2017-01-12 2 views
-1

Я ищу примеры кодирования в R или R-библиотеках, чтобы визуализировать частоты слов и отношения в сетевом графике, очень похожие на этот пример: http://koaning.io/word-clouds.html (Я имею в виду не к worldclouds, но к сетевому графику на главной странице)Рекомендации по визуализации текста (твитов) и их частот в R

До сих пор я очистил данные и имел около 1 миллиона строк с чистым текстом и рассчитанными корреляциями и частотами слов.

Я был бы очень признателен, если вы можете посоветовать мне и дать мне несколько советов по этому вопросу.

Все самое лучшее, Рене

+0

Добро пожаловать на SO. Пожалуйста, наведите курсор на тег R - он запрашивает минимальный воспроизводимый пример. [Вот руководство] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example#answer-5963610); также просмотрите файлы справки R (например, '? graph_from_edgelist', _examples_ section). После этого отредактируйте и улучшите свой вопрос соответственно. Хороший, как правило, обеспечивает минимальные входные данные, желаемые выходные данные, попытки кода, включая необходимые пакеты, - все операции копирования-вставки в новом/чистом сеансе R. * Почему? * Это облегчает для всех возможность следовать и участвовать без догадок. – lukeA

ответ

1

В качестве стартера, рассмотрим, например:

library(quanteda) 
library(igraph) 
set.seed(1) 
txt <- "I am looking for coding examples in R or R-libraries to visualize words frequencies and relations in a network graph, very similar to this example: http://koaning.io/word-clouds.html (I refer not to the worldclouds, but to the network graph on the homepage) 

So far I have cleaned the data and have about 1 million rows with clean text and calculated correlations and word frequencies. 

I would highly appreciate if you can advise me and give me some tips on that. 

All the best, René" 
plot(dfm(txt), min.freq=2L) 

enter image description here

edges <- do.call(rbind, strsplit(tokenize(x=txt, ngrams=2L, conc="_")[[1]], "_")) 
g <- graph_from_edgelist(edges, directed = FALSE) 
g <- simplify(g) 
plot(g, vertex.size=degree(g)) 

enter image description here

+0

Ничего себе, это здорово. Большое спасибо за вашу помощь lukeA! Очень признателен. Хорошего дня! –

Смежные вопросы