Мой вопрос вообще - я хочу спросить, есть ли какие-либо специальные модули в языках программирования или готовая программа, которая позволит мне выполнить мою задачу.удалить все не-ASCII из строки
Есть ли удобный способ (кроме написания собственных функций с несколькими операторами замены), чтобы автоматически заменить все национальные символы на письма-корреспонденты? Например, я хочу, чтобы заменить æ к ае, ä к , ę к е и так далее.
Если невозможно подготовить универсальную функцию, есть ли какая-либо готовая функция в используемых в настоящее время языках программирования, которая удалит такие символы, просто ограничив разрешенный символ только теми, кто имеет стандартный латинский алфавит?
Для этого требуется более подробная информация. С какой платформой и файловой системой вы работаете? И почему вы хотите сделать это в первую очередь - с какими проблемами вы сталкиваетесь с этими специальными персонажами? –
Обычный вопрос: Почему вы хотите это сделать? Вы теряете информацию, поскольку «соответствующие» буквы ASCII могут быть глупой концепцией для некоторых локалей. Особенно для имен файлов есть в основном только две вещи, которые имеют смысл: UTF-16 для Windows, UTF-8 для Unices. Все остальное - полный беспорядок, который нужно использовать так или иначе. – schlenk
** В стандартном латинском алфавите есть около 600 символов, ** вы знаете.Я должен повторить запрос от @schlenk - почему в мире вы хотели бы сделать эту злую злую вещь? Культурная узость удивительно примитивна. – tchrist