2015-07-07 2 views
0

Я пытаюсь построить диаграммы Sankey с помощью sankeyPlot() в пакете networkD3. Визуализация большая на выборке данных работ, такие как этиПовторите ввод данных для диаграмм Sankey с помощью sankeyPlot() в пакете networkD3

Узлы

node 
1124107186 
1124132760 
1124119016 
20150517 
/matte-low-dome-49354 
/accounts/account-order-list.html 
/Stepp 

и ссылки

source target value 
0  3  5 
1  3  9 
2  3  1 
3  4  6 
3  5  12 
3  6  8 

Но это трудно сделать, подготовить таблицу ссылок из файла CSV в формате

 URI       DATE_KEY TIME_KEY GUID_KEY 
/matte-low-dome-49354    20150517 145755 1124107186 
/matte-low-dome-49355    20150517 145755 1124107186 
/accounts/account-order-list.html 20150517 143857 1124132760 
/accounts/account-order-list.html 20150517 143857 1124132760 
/Stepp        20150517 143416 1124119016 
/Stepp        20150517 143415 1124119016 
/platinum-47184      20150517 145637 1124107186 

Есть ли воспроизводимый способ подготовки источника, номера целевых строк для такого набора данных?

ответ

0

Я вычислил способ сделать в Excel с помощью vlookup и pivot. Я назначил номера строк для каждой уникальной переменной записи, используя строку()

variable   row 
20150517   1 
20150518   2 
/platinum-47184 3 

и сделал ВПР с его именем в другой таблице, следовательно, получение источника и цели в виде их порядковых номеров. Затем я побежал стержень, чтобы получить количество каждого уникального сочетания переменных, как это,

source        target value 
/matte-low-dome-49354    20150517 12 
/matte-low-dome-49355    20150517 6 

Я был в состоянии использовать это в качестве входных данных для создания сюжета санки.

Это не очень программируемый способ сделать это, но он служит цели.

Смежные вопросы