2017-02-23 10 views
1

Я хочу, чтобы кошка была шведским txt-файлом.Проблема кодирования символов на Ubuntu/Bash

Для специальных символов (например, ä или é) я возвращаю эти символы: .

например. r han fr n Планета Аперны.

У меня есть несколько файлов из нескольких источников, и некоторые из них вернули правильные результаты (например, Det här är fel!), Некоторые из них вызывают вышеупомянутую проблему.

На основании этого я уверен, что проблема связана с кодировкой символа файла (en), но я просто не могу найти, как закодировать файл в командной строке.

Я пробовал:

iconv -f UTF-8 -t UTF-16 file.txt 

и похожести. Но я все время попадал в сообщение об ошибке.

У вас есть вопросы? Спасибо!

+0

Что такое вывод 'chardet file.txt'? –

+0

Наиболее распространенными кодировками для шведского являются 'iso-8859-1' и' utf-8'. В современной системе 'iconv -f iso-8859-1 -t utf-8 file.txt' должен это сделать. На дрянной старой PuTTY или древнем дистрибутиве linux 'iconv -f utf-8 -t iso-8859-1 file.txt' будет. –

+0

@RicardoBranco, спасибо, это была недостающая команда, у меня ее не было! –

ответ

1

На основе замечаний решение было:

Сначала выполните:

chardet file.txt 

, чтобы узнать кодировку.

Тогда:

iconv -f iso-8859-1 -t utf-8 file.txt 

создать "перевод".

Смежные вопросы