Часть моей работы над тезисом заключается в оценке количества методов обнаружения языка, которые уже доступны, а затем, наконец, реализовать один из них. Для этого я выбрал следующие методы,Оценка методов определения языка
- N-Gram основе текста Классификация по Cavnar и Trenkle
- статистической идентификации языка Тедом Даннинг
- Используя языковые модели сжатия на основе для категоризации текста на Teahan и Харпер
- Набор символов Обнаружение
- композиционный подход к обнаружению языка/кодирования
Я должен сначала оценить методы и предпочтительно представить таблицу с точностью для каждого из этих методов. Мой вопрос заключается в том, что для того, чтобы найти точность каждого из этих методов, нужно ли мне приступить к построению языковых моделей с использованием данных обучения, а затем проверить их и зафиксировать точность или какой-либо другой подход, который я могу здесь выполнить. Хотя большинство исследований уже содержат эти таблицы точности, я не уверен, что в моем образовании принято просто взять его и представить в отчете.
Оцените любые мысли по этому вопросу.
Похоже, это было бы вопросом для вашего советника по тезису. –
Мета-анализ (составление и обобщение предыдущих исследований) является приемлемым исследованием, но, вероятно, в этом случае недостаточно для магистров. Зависит также от вашего предмета. Является ли это промышленная обработка, информатика, машинное обучение, вычислительная лингвистика или что? – tripleee
Если вы скажете «оценить, а затем построить», как бы вы оценили что-то, чего вы не реализовали, кроме как только сообщая о предыдущих результатах, и рассуждая (смутно) о сильных и слабых сторонах? – tripleee