Я имею дело с различением двух категорий А и В эти дни, и я считаю, что если категория B содержит несколько подкатегорий B1, B2, B3 ...distinguishment с подкатегориями
Иногда отличить результат лучше явный маркировка B1, B2, B3 (суб категории этикетки), но иногда результат лучше для сбора подкатегорий и просто присваивая им B.
В другом слове, иногда
y=[A, A, A, ..., B1, B1, ..., B2, B2, ... B3, B3, ...]
лучше, но иногда,
y=[A, A, A, ..., B, B, B, ...]
лучше.
Я думаю, наивно есть два удара эффект результат:
- корпус 1 включает больше информации
- случай 2 алгоритм может сосредоточиться больше на различие А и В
Но Я не уверен, что мое предположение верно, кто-нибудь знает об этом? И когда вы имеете дело с этим случаем, когда есть подкатегории, каков ваш способ получить лучший результат?