Вы должны использовать порядковые данные только в том случае, если это имеет смысл с точки зрения данных (i.e. данные естественно упорядочены, как в случае малых, средних и больших).
В терминологии моделирования категориальная переменная имеет фиктивную переменную, созданную для каждого уровня, купите одно из возможных значений, которое оно может принять. Эффект фиктивной переменной по существу дает вам эффект этого уровня по сравнению с эталонным уровнем (уровень без фиктивной переменной). В целом, рассмотрение категориальной переменной проще, чем обработка порядковых данных.
Порядковые данные не моделируются так же, как непрерывные и категориальные (если вы не считаете значения непрерывными, что часто делается). В R пакет ordinal имеет несколько функций для выполнения моделирования, основанных на кумулятивной функции связи (функция связи преобразует данные в нечто, близкое к линейной регрессии).
Преимущество перекодировки категориальных данных в качестве порядкового номера заключается в том, что выводы, сделанные из данных, лучше представляют данные и имеют более интуитивную интерпретацию.
Хороший вопрос - надеюсь, кто-то сможет дать исчерпывающий ответ. Отчасти это связано с тем, как категориальные переменные («факторы» в R) представлены целыми числами. Поэтому 'c (« Small »,« Small »,« Small »,« Medium »,« Large »,« Large »)' будет представляться 'c (1,1,1,2,3,3)' внутренне. –