2014-01-09 2 views

ответ

4

Похоже, что вы можете найти базу данных Unihan. База данных Unihan поддерживается Консорциумом Unicode.

База Unihan является хранилищем коллективного знания Unicode Консорциума в отношении к CJK Унифицированные идеографические, содержащихся в стандарте Unicode. Он содержит данные сопоставления, позволяющие преобразовывать в и из других кодированных наборов символов и дополнительную информацию , чтобы помочь реализовать поддержку различных языков, в которых используется идеографический сценарий Han .

Например, здесь the data for 爱.

Адрес the description of the organization and content из Unihan Database. Обязательно прочтите это, чтобы понять, на что ссылаются данные.

Если информация, которую вы хотите, вы можете download the ZIP archive, которая содержит все эти данные.

В базе данных Unihan нет произнесений Bopomofo (Zhuyin), но они имеют показания пиньинь. Преобразование из Пиньинь в Чжуин простое; есть много онлайн-инструментов, которые могут сделать это за вас.

Что касается проблем с лицензированием, файлы данных базы данных Unihan имеют a liberal copyright notice. Таким образом, вы не должны сталкиваться с какими-либо проблемами с использованием этих данных в своем собственном программном обеспечении.

+0

Спасибо! Я нашел [другую базу данных] (http://www.mdbg.net/chindict/chindict.php?page=cedict), но unihan, похоже, лучше подходит для проблемы. Я также написал JS пиньинь для zhuyin конвертер: https://github.com/nathanathan/pinyinToZhuyin –

0

это немного поздняя запись, но я искал то же самое в прошлом году и закончил сборку моей собственной базы данных/bopomofo на основе множества различных наборов данных. Я поместил достаточно работы в эту штуку, чтобы полностью называть ее своей, хотя так вы должны ее проверить! его часть рубигема, которую я сделал для сортировки по bopomofo (у меня была система, которая не позволила бы мне изменять настройки коллимации базы данных) https://github.com/nallan/a-b-chi

Смежные вопросы