2015-10-15 4 views
0

Я использую пакет «дискретизации» из R. При поиске точек разреза я получаю следующий результат.Как управлять CutPoints (при выполнении контролируемого бинирования) в R

Команда:

discretization::cutPoints(data3$Dist_to_Stream, data3$Malaria_w3) 

, где Dist_to_Stream является переменной числовых значений и Malaria_w3 класс (категоричны)

[1] 5.118175 95.484400 119.386500 300.842000 311.320500 
[6] 338.104000 387.722500 460.783000 472.821500 551.741500 
[11] 910.745500 214.143000 234.124500 260.812000 358.513000 
[16] 361.015500 449.447500 538.411500 589.118500 626.888000 
[21] 657.261000 648.304500 698.310500 953.814500 1091.265000 
[26] 1181.350000 2023.885000 2040.360000 2069.390000 2201.395000 
[31] 2120.185000 2142.255000 2456.820000 2819.860000 

Выходные сочленения слишком много (34 бункеров). Есть ли способ контролировать количество точек выреза при контролируемом (основанном на энтропии) бининге?

Заранее спасибо ..

ответ

0

Функция discretization пакета R не обеспечивает такой аргумент, чтобы контролировать количество бункеров (Discretization Documentation). Это можно легко сделать с помощью опции SPSS Optimal Binning. Можно установить максимальное количество ящиков (все еще его контролируемое биннинг) перед выполнением биннинга.

Для получения дополнительной информации Optimal Binning.

Смежные вопросы