Моих данных имеют следующий формат:случайный леса для двоичных данных
stock st1 str2 str3 str4 str5 str6 str7 str8
A 1 0 0 0 1 0 0 0
A 0 0 0 0 0 0 0 0
A 1 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
B 1 0 0 0 1 0 0 0
C 0 0 0 0 0 0 0 0
C 1 0 0 0 1 0 0 1
C 0 0 0 0 0 0 0 0
C 0 0 0 0 0 0 0 0
C 1 0 0 0 1 0 0 1
A 0 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
A 1 0 0 0 0 0 0 0
A 0 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
B 0 0 0 0 0 0 0 0
C 1 0 0 0 0 0 0 0
Я новичок в анализ данных, и я хотел бы знать, какой анализ я мог бы осуществить в этом формате данные. Возможно ли иметь случайный лес и обрезку дендрограммы?
, что найти способ, как найти кластеры/группу и увидеть в dendogram столбцов st1, str2, str3 и т.д.
, что именно вы хотите сделать, это не очень понятно. Вы хотите: (1) Найти кластеры в каждом из типов запасов (A, B, C)? ИЛИ (2) Найти шаблоны в str1, str2, str3 ..., соответствующие биркам акций? –
@sandipan это второй случай, который вы упомянули – Jake