В недавнем question было отмечено, что в OSX, выполняющем sed в файле non ascii, даются странные результаты. Например, если вы делаете (/ USR/бен/кал случайный двоичный файл)LANG и sed на OSX
sed 's/[^A-Z]//' /usr/bin/cal
sed
удалит все, кроме A-Z печатаемых символов, но многие непечатаемые символы остаются. Если, однако, вы делаете
LANG='' sed 's/[^A-Z]//' /usr/bin/cal
выводятся только A-Z (и символы новой строки). Зачем?
Обычно LANG=en-US.UTF-8
Что происходит? Я все равно не вижу, что вывод sed можно считать правильным в UTF-8. Разбито ли это, или есть какое-то представление о работе, которое я не понимаю?
Я знаю, что OSX sed соответствует POSIX и поэтому отличается от любимого GNU sed.