2014-10-28 7 views
0

Часть моей работы над тезисом заключается в оценке количества методов обнаружения языка, которые уже доступны, а затем, наконец, реализовать один из них. Для этого я выбрал следующие методы,Оценка методов определения языка

  1. N-Gram основе текста Классификация по Cavnar и Trenkle
  2. статистической идентификации языка Тедом Даннинг
  3. Используя языковые модели сжатия на основе для категоризации текста на Teahan и Харпер
  4. Набор символов Обнаружение
  5. композиционный подход к обнаружению языка/кодирования

Я должен сначала оценить методы и предпочтительно представить таблицу с точностью для каждого из этих методов. Мой вопрос заключается в том, что для того, чтобы найти точность каждого из этих методов, нужно ли мне приступить к построению языковых моделей с использованием данных обучения, а затем проверить их и зафиксировать точность или какой-либо другой подход, который я могу здесь выполнить. Хотя большинство исследований уже содержат эти таблицы точности, я не уверен, что в моем образовании принято просто взять его и представить в отчете.

Оцените любые мысли по этому вопросу.

+0

Похоже, это было бы вопросом для вашего советника по тезису. –

+0

Мета-анализ (составление и обобщение предыдущих исследований) является приемлемым исследованием, но, вероятно, в этом случае недостаточно для магистров. Зависит также от вашего предмета. Является ли это промышленная обработка, информатика, машинное обучение, вычислительная лингвистика или что? – tripleee

+0

Если вы скажете «оценить, а затем построить», как бы вы оценили что-то, чего вы не реализовали, кроме как только сообщая о предыдущих результатах, и рассуждая (смутно) о сильных и слабых сторонах? – tripleee

ответ

1

Я также предлагаю просить вашего советника по тезису. Реализация всех из них будет большой работой, и очень сложно реально сравнить их, не имея возможности проверить их. Если я правильно помню, последние три не были хорошо оценены в литературе, поэтому было бы сложно сравнить их результаты. Я сам реализовал (и оценил) только первый из них. Один большой вопрос заключается в том, насколько большой частью вашего тезиса является эта оценка и реализация LI?

+0

Оценка и реализация LI - один из шести вопросов исследования, которые у меня есть в моей диссертации. Степень бакалавра, которую я занимаюсь, - математика и приложения, все исследование было сосредоточено на алгоритмах, структурах данных и разных языках программирования. Итак, в моем тезисе я сделал следующее, проанализировав их рабочий процесс. – Vinod

+0

Продолжение .. 1.Анализация рабочего процесса на LSP, 2.Анализация открытого API перевода, 3.Implementing сервер для LSP с использованием API, 4.Adding LI на сервер. Поэтому реализовать LI не так сложно, я просто ищу некоторые способы показать причину, по которой я выбрал метод. – Vinod

Смежные вопросы