У меня есть следующая команда для замены символов Unicode на ASCII.Как заменить символы Unicode на ASCII
sed -i 's/Ã/A/g'
Проблема заключается в том Ã
не распознается SED команды в моей среде Unix, так что я предполагаю, что вы заменить его шестнадцатеричное. Как бы выглядел синтаксис, если бы я вместо этого использовал C3
?
Я использую эту команду в качестве шаблона для других персонажей я хотел бы заменить пробелами, таких как:
СЕПГ -i «s/©// г»
Вы имеете в виду вот это? http://stackoverflow.com/questions/22450563/sed-matching-unicode-blocks-with – Leo
Какой набор символов используется вашим терминалом? И какая кодировка использует входной текст? Ã в UTF-8 - 0xC3 0x83, а символ 0x83 - это управляющий код в ISO 8859-1, так что это может быть проблемой. Полагаю, вы не можете просто установить в вашей системе 'LANG = en_US.UTF-8'. – yellowantphil
«sed» выполнит эту работу. Пожалуйста, см. Мой ответ. – ajaaskel