Содержание ввода является кусок HTML, скопированный из окна WebKit, какPerl, редактирование на месте портит кодировку текста
Это правильно отображается в WebKit с помощью UTF-8.
То, что я хочу сделать, это заменить все теги, я использую этот один вкладыш:
perl -i -pe "s/<img.+?>//g"
вход является RichText я скопировал в мой буфер обмена и перенаправляется в этот однострочника другой программой , наверное, это что-то вроде:
echo "rich html text" | perl -i -pe "s/<img.+?>//g"
Ну, это удалить <img>
теги, но все символы Unicode испорчены после подстановки.
Я на Windows 7, языковой стандарт En - США. Кодовая страница cmd уже установлена в UTF-8. Это не работает, даже если я передаю опцию -C
.
Есть ли способ сохранить код как однострочный, заставляя его работать для ввода Unicode?
http://stackoverflow.com/q/627661/725418 – TLP
Вместо perl вывести на stdout или файл, чтобы убедиться, что это не ваша первая программа, которая сначала помещает контент. –