2014-12-14 3 views
0

Я не уверен, что я делаю неправильно здесь, но я надеюсь, что кто-то может мне помочь. Я пытаюсь запустить x-validation в быстром шахтере с кластером k-mean в качестве моей модели.Clustering with Cross Validation in Rapid Miner

Я импортирую свой набор данных, задаю роль «метки» по одному атрибуту, преобразую данные из номинального в числовой, а затем подключаю этот вывод к процессу х-валидации. Затем я соединяю данные обучения с моделью кластеров k-mean и подключаю модель кластеризации к модели для данных тестирования. Я применяю модель из модели k -средства, а затем применяю процесс производительности.

Я продолжаю получать сообщение об ошибке, что мне нужен специальный атрибут 'label'.

Я не уверен, что я делаю здесь неправильно, любая помощь приветствуется.

Основной процесс: main-process

процесс Х-проверка: x-validation

Сообщение об ошибке: error

ответ

0

X-проверка требует метки и предсказания. Кластеризация не дает прогноза; он выделяет примеры для разных кластеров. Чтобы изменить распределенный кластер на прогноз, вы можете использовать оператор Map Clustering on Labels. Поместите это между операторами Apply Model и Performance.

Если количество кластеров отличается от числа допустимых значений меток, процесс будет ошибочным.

0

Если вы хотите проверить свою кластеризацию в валидации, может потребоваться процедура начальной загрузки. Бутстрапирование может быть легко архивировано с использованием цикла и оператора примера. Приложен процесс, который делает это.

Если вы используете сопоставление с кластеризацией для маркировки, вы просто получаете производительность из проверки. Если вы хотите иметь кластерные примеры, вы можете использовать X-Prediction с тем же трюком.

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<process version="6.1.001-SNAPSHOT"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="6.1.001-SNAPSHOT" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="retrieve" compatibility="6.1.001-SNAPSHOT" expanded="true" height="60" name="Retrieve Sonar" width="90" x="112" y="75"> 
     <parameter key="repository_entry" value="//Samples/data/Sonar"/> 
     </operator> 
     <operator activated="true" class="loop" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Loop" width="90" x="313" y="75"> 
     <parameter key="iterations" value="10"/> 
     <process expanded="true"> 
      <operator activated="true" class="sample_bootstrapping" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Sample (Bootstrapping)" width="90" x="179" y="30"/> 
      <operator activated="true" class="k_means" compatibility="6.1.001-SNAPSHOT" expanded="true" height="76" name="Clustering (2)" width="90" x="313" y="30"/> 
      <connect from_port="input 1" to_op="Sample (Bootstrapping)" to_port="example set input"/> 
      <connect from_op="Sample (Bootstrapping)" from_port="example set output" to_op="Clustering (2)" to_port="example set"/> 
      <connect from_op="Clustering (2)" from_port="cluster model" to_port="output 1"/> 
      <portSpacing port="source_input 1" spacing="0"/> 
      <portSpacing port="source_input 2" spacing="0"/> 
      <portSpacing port="sink_output 1" spacing="0"/> 
      <portSpacing port="sink_output 2" spacing="0"/> 
     </process> 
     </operator> 
     <connect from_op="Retrieve Sonar" from_port="output" to_op="Loop" to_port="input 1"/> 
     <connect from_op="Loop" from_port="output 1" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
Смежные вопросы