Первый вопрос здесь - я искал вокруг, чтобы собрать ответ на этот вопрос, но до сих пор дошел до пустого.Удалить строки с японскими символами из файла
У меня есть многострочный текстовый файл, который я очищаю. Частью этого является удаление строк, содержащих японские символы. Я использовал sed
для других операций, но в этом случае он не работает.
У меня создалось впечатление, что использование переключателя -r
и регулярного выражения \p{Han}
будет работать (от просмотра других подобных вопросов), но в этом случае он не работает.
Вот моя тестовая строка - запуск этого возвращает полную строку и не отфильтровывает символы JP, как я ожидал.
echo 80岁返老还童的处女: 第3话 | sed -r "s/\\p\{Han\}//g"
Я что-то не хватает? Есть ли другая команда, которую я должен использовать вместо этого?
вы знаете, у вас есть другие символы в файле, кроме японского и ACSII символов? – syadav
Да. Файл представляет собой список названий книг, очищенных от Amazon, так что там есть небольшая мешанина. – Elliotpage