Представьте себе, что все известные отображения между значениями набора переменных V и набора имен тегов T (классификационные метки) были известны. Далее предположим, что общее пространство уникальных комбинаций переменных значений велико (> 100B точек), размер набора тегов относительно невелик (тысячи элементов), а число переменных очень мало (4-10).Совершенная классификация дерева решений
Что такое алгоритм для построения функции классификатора, который обеспечивает идеальное отображение (соответствие априорного знания без ложных срабатываний или ложных негативов) от значений переменных меток со следующим пространством и сложность времени цели:
- Временная сложность меньше, чем O (| V | * войти | T |)
- Пространство сложности меньше, чем O (| V | к), к ≤ е
Или перефразировать как проблема дерева решений:
- Как алгоритм дерева решения быть настроен, чтобы создать совершенное отображение?
- Каким образом данные обучения могут быть представлены эффективно, чтобы гарантировать это?
Вы не определили, что такое «идеальное» отображение. – phs
@phs хороший улов; исправлено. – Sim
Как представлены предшествующие знания? Как вы можете сказать, к какому классу принадлежит какой-либо экземпляр, без перечисления всех возможностей? Мне кажется, что * это * - это правило классификации, которое вы должны использовать, а не пытаться получить дерево решений в соответствии с этими предшествующими знаниями. Может быть, если вы объясните контекст? –