2008-08-16 2 views
8

У нас есть веб-приложение предприятия, где каждый бит текста в системе локализуется в настройках культуры браузера пользователя.Любые хорошие ресурсы или советы для работы с языками с разной ориентацией? (например, японский или китайский)

До сих пор мы поддерживали только английский, американский (аналогичный, но ошибочный ;-) и французский (для канадского Gov't - приложение на английском или французском языках в зависимости от предпочтений пользователя). Во время развития у нас также были некоторые европейские языки, как голландцы и немцы, которые склонны сочетать слова с очень длинными.

В настоящее время мы изучаем поддержку восточных языков: китайского, японского и так далее. Я понимаю, что они используют фонетический вход, преобразованный в письменные символы. Как это работает в Интернете? Выполняют те же события, когда редактируются входы и текстовые поля (мы довольно тяжелые Ajax).

В каких конвенциях пользователи этих нисходящих языков ожидают онлайн?

Какое влияние оказывает их двойной вход (фонетическая типизация + преобразование) на веб-элементы управления?

С языками RTL, такими как арабский, пользователи ожидают, что весь интерфейс будет зеркальным? Например, если вещи, такие как кнопки ОК/Отмена, меняются местами и слева?

+0

Я не знаю ответа на ваш вопрос, но вы можете просмотреть это, если вы еще этого не сделали: [Абсолютный минимум Каждый разработчик программного обеспечения Абсолютно, положительно должен знать о юникоде и наборах символов (никаких оправданий!) ] (http://www.joelonsoftware.com/articles/Unicode.html). (Если это уже область, с которой вы знакомы, не стесняйтесь переходить к лучшему ответу :)) – 2008-09-02 13:46:03

ответ

5

Прочитано Globalization Step-by-Step от Microsoft.

Я могу ответить на специфику CJKV, но вам, вероятно, нужна книга по этой теме. Я не читал его, но CJKV Information Processing от O'Reilly (2-е изд., Декабрь 2008 г.).

Я понимаю, что они используют фонетический вход, преобразованный в письменные символы. Как это работает в Интернете?

Ввод осуществляется классом программного обеспечения под названием IME (Input Method Editor) на Windows, Mac и Linux (например, SCIM). Когда IME включен, вход с клавиатуры сначала переходит в IME, и пользователь получает возможность выбрать подходящую комбинацию кандзи/хирагана. Когда пользователь совершает ошибку, нажав клавишу возврата, типы IME в кандзи/хирагане попадают в веб-браузер с использованием текущей кодировки. Кодировка ситуации была большой беспорядок, но если вы пишете веб-приложение, пойдите с кодировкой Unicode. Я предлагаю UTF-8.

Выполняют ли те же события огонь, когда входы и текстовые поля редактируются?

Unicode savvy web browser и OS combo обрабатывают несколько языков. Например, можно использовать английскую стандартную версию Firefox для просмотра и публикации на японском веб-сайте. С точки зрения браузеров это всего лишь массив «bla bla bla» в Unicode. Другими словами, если событие запускается на английском языке, одно и то же событие должно запускаться в CJKV, если вы используете вариант Unicode.

В каких конвенциях пользователи этих нисходящих языков ожидают онлайн?

Читатели CJKV ожидают, что слева направо онлайн. Учебники по математике и естественным наукам написаны слева направо. Большинство текстовых процессоров, включая локализованную версию Word, записывают слева направо.

Какое влияние оказывает их двойное входное (фонетическое типирование + преобразование) на веб-элементы управления?

По большей части вам не придется беспокоиться об этом, если вы не занимаетесь клавиатурой. Например, я ненавижу использование японской клавиатуры с добавлением дополнительной клавиатуры. Поэтому, когда мне нужно назначить команду IME on/off на какой-либо ключ на клавиатуре США. Я лично использую right-Alt. Кроме того, во время преобразования используется пробел и клавиша ввода, но не уверены, передаются ли эти события в браузер.

Если вы хотите, я могу проверить ваш сайт. (мое имя пользователя) @gmail.

8

Как арабский оратор, когда я смотрю арабские сайты, я ожидаю, что такие вещи, как ОК/Отмена, будут заменены. При чтении на арабском языке мои глаза читаются справа налево. Таким образом, в ситуациях, когда вы хотите, чтобы читатель просматривал кнопку подтверждения/действия (например, «ОК», «Отправить», «Да» и т. Д.) Перед нажатием кнопки «Негативный/Бездействие» («Отмена», «Очистить», «Нет» и т. Д.), хочу поставить первый справа.

Предостережение: Как это ни странно, вышеизложенное применимо только ко мне лично, когда текст кнопки находится на арабском языке. Если текст кнопки находится на английском языке (на веб-странице на смешанном языке), я бы предпочел увидеть кнопку «ОК» слева.

Надеюсь, что это поможет.

2

Направленность вопроса легко ответить для восточноазиатских языков: веб-сайты слева направо, сверху вниз, как обычно.

Фактически, общие принципы компоновки веб-дизайна почти одинаковы. Посмотрите на сайты newspaper (имя вверху слева, панель навигации внизу с «Главная» слева, заголовки внизу внизу с наиболее важными вверху) или search engine (не думаю, что мне нужно сказать, какой американский сайт вы должны сравнить этот макет).

Однако, как и слова арабского/иврита/и т. Д. Право-левый, в некоторых контекстах ожидается фрагментация слева направо (встроенные фрагменты на английском языке и т. Д.), Есть ситуации, даже в Интернете, где Предпочтительным является расположение сверху вниз. Обычно это делается путем включения изображения с макетом текста и желаемым шрифтом или с использованием вспышки.

Internet Explorer на самом деле предложил tb-rl-макет с CSS writing-mode property с версии 5.5, однако none of the other browsers потрудились реализовать его (или рубин, что полезно для сайтов, предназначенных для молодой аудитории). IE 5.5 был выпущен в 2000 году, так что это восемь лет поддержки, и в 2003 году был W3C candidate recommendation, но text layout in CSS still being poked around.

Что касается ваших проблем с вводом текста и IME, если вы не делаете что-то фиктивное, например, пытаетесь вручную перевести виртуальные ключи, данные событиями keydown в текстовые строки, вы вряд ли столкнетесь с проблемами.

Есть некоторые дополнительные проблемы, которые вы не упомянули. Минимальный удобный размер шрифта больше, чем для языков, написанных латинским шрифтом. Жирный и курсивный для выделения в потоке, как правило, не подходит. Унификация Han означает необходимость придирчивости к указанию правильных шрифтов для разных языков CJK при работе с unicode. Возможно, вы захотите предоставить как традиционные, так и упрощенные интерфейсы для китайцев, в зависимости от того, какую аудиторию вы ожидаете.

Я собираюсь написать более подробное руководство по этим строкам какое-то время, если вам нужна дополнительная информация, не стесняйтесь пинать меня.

Смежные вопросы