В рамках более крупного проекта я хочу внедрить машинный переводчик с языка A на язык B. Поскольку не доступные инструменты, которые автоматически делают машинный перевод над этим набором языков, и доступный корпус языком B достаточно мал, Я пытаюсь сделать следующее:Лучший алгоритм парсера для передачи лексической структуры?
1. Учитывая предложение в язык A, используйте инструмент, чтобы получить его набор языков A Теги PoS (Part of-speech).
2. Инструмент, который я использую для пометки PoS (Freeling), не возвращает дерево синтаксического анализа, поэтому я подумал о создании собственного дерева синтаксиса из набора тегов.
3. После того, как дерево синтаксического анализа завершается, пересекают его по уровням (начиная от корня) и изменять порядок его элементы в соответствии с правилами грамматики языка B.
После выполнения некоторых исследований я узнал о Эрли разборе (чья способность разбора любого языка привлекло мое внимание, потому что грамматика на языке В может измениться сверхурочно, поэтому я не могу гарантировать, что он всегда будет соответствовать какому-либо конкретному критерию). Однако, учитывая, что моя конечная цель заключается в передаче структуры, я не уверен, что если использовать синтаксический анализатор снизу вверх и попытаться изменить порядок элементов в соответствии с правилами, это даст мне лучшую производительность, или если я нахожусь на неправильный путь и мое решение ошибочно вообще.
прохладный человек, я думаю, есть, у вас есть git? –
нет, у меня нет учетной записи git. Почему вы спрашиваете? – Yukypack