2016-01-23 1 views
-2

Я хочу перевести английский язык на язык x, для этого Во-первых, преобразуйте английские символы в эквивалентный английский Unicode , а затем переведите английский Unicode в x Unicode , затем x Unicode для символов x. Итак, я хочу конвертировать один язык Unicode в эквивалентный другой язык Unicode, используя язык c или любой другой.Можно преобразовать один язык в unicode на другой язык в формате unicode?

для примера, я хочу, чтобы преобразовать "Linux" (например, слово) с английского на тамильском "லினக்ஸ்"

Unicode для "Linux" (например, слово): 004C 0069 006e 0075 0078

является их возможность конвертировать этот английский Unicode в тамильский эквивалент Unicode?

+5

Юникод - Юникод. Стандарт эволюционировал с годами, но все языки имеют один и тот же Юникод, и в этом весь смысл. В старые времена IBM (например) имела разные наборы символов для разных языков. Unicode заменил все это. – cdarke

+0

Возможно, вы думаете о замене однобайтовых символов (например, ASCII или ISO Latin 1) на многобайтовые? В python см. Модуль 'codecs', в C см. Http://stackoverflow.com/questions/11576846/convert-ascii-string-to-unicode-windows-pure-c. Если вы используете Python 3, или Java, или C#, родные строки - Unicode. – cdarke

+0

Непонятно, что вы хотите делать. Можете ли вы привести несколько примеров входов и выходов? –

ответ

2

Вы не можете сделать шаг «конвертировать английский язык в unicode в x язык unicode». Unicode - это кодировка, в которой каждый символ с каждого языка имеет уникальную кодовую точку, поэтому нет ничего, кроме «английского юникода» или «х языка Unicode» - это один тип кодирования. То есть для буквы «i» существует представление 0x2A (а не реальная точка кода, просто для объяснения), а 0x2A в unicode всегда будет «i» независимым от языка.

+2

Простите меня, но 0x002A '' ', или это бессознательное использование ответа на жизнь, вселенную и все такое? – cdarke

+1

Как указано в скобках 0x2A «не настоящая кодовая точка» для моего примера с «i». Конечно, поскольку unicode совместим с ASCII, поэтому любое число от 0 до 128 будет легальным кодовым кодом юникода. Но я получил вашу точку зрения «42», и да, это было без сознания. :) – Nikita

+1

Я думаю, что правильно сказать, что от 0 до 255 в Юникоде есть ISO Latin 1 http://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT. 0 до ** 127 ** - это ASCII, и да, это невероятно педантично. – cdarke

Смежные вопросы