Каков наилучший способ преобразования строки из Unicode в ASCII без изменения ее длины (что очень важно в моем случае)? Также символы без проблем преобразования должны находиться в тех же позициях, что и в исходной строке. Таким образом, «Ä» необходимо преобразовать в «A», а не что-то загадочное, у которого больше символов.Преобразование Unicode в ASCII без изменения длины строки (на Java)
Редактировать:
@novalis - Такие символы (например, азиатские языки) должны быть просто преобразованы в некоторые заполнители. Меня не интересуют эти слова или что они означают.
@MtnViewMark - Я должен сохранить любое количество символов и позицию доступных символов ASCII при любых обстоятельствах.
Дополнительная информация: У меня есть инструменты для интеллектуального анализа текста, которые могут обрабатывать только строки ASCII. Большая часть текста, который должен быть обработан, написан на английском языке, но некоторые из них содержат символы не ASCII. Меня не интересуют эти слова, но я должен быть уверен, что слова, которые меня интересуют (те, которые содержат только символы ASCII), находятся на тех же позициях после преобразования строки.
Что вы намерены преобразовать 口水 雞 в? Я не знаю, как можно выразить концепцию курицы слюны в трех символах ascii. – novalis
Неясно - пытаетесь ли вы сохранить количество символов или количество байтов ... или, возможно, ширину строки при отображении? – MtnViewMark
@novalis +1 для курицы слюны :-) –