2016-06-29 3 views
1

Я искал модели коррекции правописания, и я пытаюсь найти некоторые оценочные показатели. Если вы считаете, что ложные негативы пытаются исправить уже правильное слово и ложные срабатывания, чтобы пропустить ошибку, вы можете рассчитать точность, отзыв и точность. Однако эти показатели не говорят ничего о качестве модели коррекции (независимо от того, успешно ли она исправило неправильное слово в том, что пользователь намеревался ввести), и оценивает только заклинание , проверяя возможности, а не возможности исправления.Каковы некоторые оценки для модели коррекции правописания?

ответ

0

На многих языках самая сложная часть выбирает правильную замену среди многих кандидатов. Например, должен ли lck быть lack, lick, lock, ick, или luck? (Из контекста, конечно, вы не можете сказать!)

Таким образом, метрика, которую вы ищете, представляет собой количество точных исправлений. Ошибки, которые вы не пытались исправить, и исправленные слова, которые вы неправильно заменили, будут заглушены найденными вами ошибками, но точно не исправлены, хотя вы все равно можете разделить эти случаи отдельно.

Если ваш алгоритм ранжирования кандидата по кандидату является автономным, вы можете значительно увеличить этот процесс, оценив его по отдельности.

+0

Так что я мог бы измерить процент ошибок, которые были успешно исправлены? Что бы я назначил ложным отрицательным и ложным положительным, чтобы получить измерение ** качества ** исправлений? – Jonathan

+0

Ложные негативы и ложные срабатывания на самом деле не имеют особого смысла здесь ИМХО; они являются классификационным измерением, а не измерением коррекции. Быстрый поиск в googling [* Оценка качества обслуживания в коррекции орфографии с использованием расхождения Kullback-Leibler * (Varol & Bayrak 2011)] (http://opensample.info/estimation-of-quality-of-service-in-spelling- коррекция-использование-kullback-leibler-расхождение), но я не могу сказать, если это полезно. (Я отмечаю ошибку пунктуации в абстрактном тексте.) – tripleee

+0

Если вы хотите сжать это в FP/FN-модель, можете считать ложными негативами ошибки, которые система не пыталась исправить, а как ложные срабатывания какая-либо коррекция который не дал правильного результата. Истинные негативы, тогда, являются правильно записанными словами, которые не были изменены, и истинными позитивами, успешными исправлениями. (Это инвертирует ваш смысл «положительный» и «отрицательный», но для меня это имеет большее значение.) – tripleee

Смежные вопросы