2009-10-11 2 views
0

Если у меня есть входное пространство (1,2, ... 999). И у меня есть класс концепции C, с 10 понятиями: C0, C1, C2 ... C9.Вопрос о VC Размер

Учитывая вход, этот вход является элементом ci, если он содержит цифру i. Например, число 123 является элементом c1 и c2 и c3.

Что такое VC Dimension этой концепции класса C?

+0

Звучит как домашнее задание для меня ... –

ответ

2

Я не хочу, чтобы получить возможность отправлять все решения здесь, но вот что-то ...

Поиск измерение VC включает в себя нахождение множества точек в исходном пространстве, которое может быть shattered через С.

Я легко могу найти набор из трех точек, которые могут быть разбиты C, (14, 24, 3).

Труднее найти набор из четырех точек, которые могут быть разбиты C, но (157, 256, 367, 4) работает.

Очень сложно найти пять точек, которые могут быть разбиты C, что настоятельно предполагает, что размер VC для C (учитывая входное пространство) равен 4. Однако сложная часть доказывает, что невозможно найти любой набор из пяти очков, которые могут быть разрушены.


Собственно, может возникнуть некоторая двусмысленность в вопросе. Это зависит от того, в каком смысле класс концепции может «правильно классифицировать» набор точек. То есть C1 правильно классифицирует (1, 2), где 1 дается метка отрицательного класса, а 2 дается положительная (так как она разбивает ее правильно) или может ли это сделать только C2? Я предположил, что это возможно, потому что проблема немного интереснее.

+0

Можете ли вы объяснить, почему '(157, 256, 367, 4)' работает? Я вижу четыре разных понятия - что затруднит использование прямой линии, чтобы классифицировать их все? (если они не выложены на числовой линии ... не так ли?) Можете ли вы прояснить – CodyBugstein

0

Действительно ли этот ответ правильный?

Разрушение означает, что для выбранного вами набора точек данных, например. (14,24,3), для всякой возможной маркировки существует понятие в множестве, соответствующее этой маркировке.

Но рассмотрим пример (14,24,3) дано, вот список всех возможных истинных/ложных разметок для этих трех точек, и какие классы согласуются с ними:

0 0 0 C_5, C_6, C_7, C_8, C_9, C_0 все согласуется только с этим

0 0 1 C_3 (поскольку третий номер три, и только класс C_3 его содержит)

0 1 0 C_2 и C_4 (потому что " 24 "содержит 2 и 4)

0 1 1 C_2, C_4 и C_3

1 0 0 C_1 и C_4

1 0 1 нет последовательных классов (потому что "14" и "3" не DonT разделяют любые цифры общего)

1 1 0 C_4 (потому что "14" и «24» и содержат 4)

1 1 1 не совместимые классы

Поэтому множество классов не разбить этот набор данных. (Или я что-то не понимаю в определении?)

Смежные вопросы