2017-01-05 3 views
-2

Я делаю проект, который включает NLP. Мне нужно транслитерировать тамильскую строку на английскую строку (в тангвистической форме), например «இல்லை» на «illai».Как преобразовать строку tamil в английскую строку в java

Как я могу это сделать с помощью java ?? Помогите мне с образцом кода

+0

0 Возможно, вам повезло с помощью [API перевода Google] (http://stackoverflow.com/a/16325094/4541045) – ti7

+0

Это действительно зависит от того, какие символы непосредственно переводимы на значения на английском языке или на английском языке изменение версии на основе набора правил? –

+4

Вы, кажется, ищете транслитерацию, превращая символы тамилов в латинский алфавит. Искать в «транслитерации», а не в переводе, это совсем другое дело. – rossum

ответ

0

Поскольку в поле имеется только 72 символа, создайте таблицу переводов, а затем создайте новую строку, проверив каждый символ, если символ можно перевести, прежде чем добавлять его в список.

Например U+0B87 (இ) становится i

Если вы больше знакомы с Java и/или имеют очень большое количество материала для перевода, есть вероятно несколько обработки оптимизации, чтобы ускорить процесс, но Я подозреваю, что вышеупомянутое будет основой хорошего решения.

Если у вас есть только небольшое количество материала для перевода или это одноразовое задание, может возникнуть смысл просто использовать Google Translate и получить входной перевод под полем ввода.

Смежные вопросы