2016-01-29 4 views
0

Извините, если это очень новичок, чтобы задать вопрос. Но я недавно начал изучать Rapidminer. Я использовал его для кластеризации моих данных образца [с использованием кластеризации K-mean]. Мой запрос заключается в том, что я использую файл данных excel raw data для кластера, как я могу вернуть данные excel назад [выходные данные] в кластеры K в файле excel. Я знаю, как создавать кластер и переключаться между экранами «Дизайн и результаты».Rapidminer - k-mean query

Заранее спасибо.

ответ

0

Привет и добро пожаловать в stackoverflow и RapidMiner.

Если я правильно понимаю ваш вопрос, вы читаете ваши данные из excel, делаете кластеризацию, а затем хотите, чтобы отдельные кластеры возвращались в Excel.
Если вы хотите сделать это вручную, вы можете использовать оператор «Примеры фильтров» и фильтр для конкретного кластера. Вы также можете сделать это автоматически с помощью оператора «Loop Values», где вы устанавливаете атрибут loop для кластера и используете макрос итерации внутри цикла для фильтрации ваших данных. Затем вы можете сохранить свои данные и использовать итерационный макрос для имени файла.
См процесс образец ниже (вы можете скопировать его и вставить его в панели XML непосредственно в RapidMiner):

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<process version="7.0.0"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="7.1.000-SNAPSHOT" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="generate_data" compatibility="7.1.000-SNAPSHOT" expanded="true" height="68" name="Generate Data" width="90" x="112" y="34"/> 
     <operator activated="true" class="generate_id" compatibility="7.1.000-SNAPSHOT" expanded="true" height="82" name="Generate ID" width="90" x="246" y="34"/> 
     <operator activated="true" class="k_means" compatibility="7.1.000-SNAPSHOT" expanded="true" height="82" name="Clustering" width="90" x="447" y="34"> 
     <parameter key="k" value="5"/> 
     </operator> 
     <operator activated="true" class="loop_values" compatibility="7.1.000-SNAPSHOT" expanded="true" height="82" name="Loop Values" width="90" x="715" y="34"> 
     <parameter key="attribute" value="cluster"/> 
     <process expanded="true"> 
      <operator activated="true" breakpoints="after" class="filter_examples" compatibility="7.1.000-SNAPSHOT" expanded="true" height="103" name="Filter Examples" width="90" x="179" y="34"> 
      <list key="filters_list"> 
       <parameter key="filters_entry_key" value="cluster.equals.%{loop_value}"/> 
      </list> 
      </operator> 
      <connect from_port="example set" to_op="Filter Examples" to_port="example set input"/> 
      <connect from_op="Filter Examples" from_port="example set output" to_port="out 1"/> 
      <portSpacing port="source_example set" spacing="0"/> 
      <portSpacing port="sink_out 1" spacing="0"/> 
      <portSpacing port="sink_out 2" spacing="0"/> 
     </process> 
     </operator> 
     <connect from_op="Generate Data" from_port="output" to_op="Generate ID" to_port="example set input"/> 
     <connect from_op="Generate ID" from_port="example set output" to_op="Clustering" to_port="example set"/> 
     <connect from_op="Clustering" from_port="clustered set" to_op="Loop Values" to_port="example set"/> 
     <connect from_op="Loop Values" from_port="out 1" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
+0

Большое спасибо David. Да, я понял ваше решение немного. Я буду google дальше. Есть ли готовые учебники для этого. Могу ли я написать все свои кластеры на разные листы в excel? Ценю вашу помощь. – Deven

Смежные вопросы