Я имею дело с загрузочными файлами Concordance и должен их редактировать, и поэтому я использую Python для этого. Столбцы разделены символом пиксора ¶
и имеют þ
как катчар.Python csv reader multi-character quotechar?
Проблема заключается в катчаре, модуль csv в python принимает только односимвольный код (нет проблемы при написании файла csv).
Вопрос: Как я могу прочитать CSV-файл в Python, где катчар является многосимвольным?
Пример Файл- CSV:
þcol_1þ¶þcol_2þ¶þcol_3þ¶þcol_4þ
Можете ли вы перейти на Python 3? Модуль 'csv' использует тип' str' в 2 и 3, а в Python 3, будучи полностью осведомленным в Unicode, 'þ' - всего один код. –
На самом деле, что * encoding * используется для этого файла? Только если файл использует многобайтовую кодировку (любая переменная, такая как UTF-8 или фиксированная как UTF-16), проблема Python 2 может возникнуть здесь. Если это делается в * 8-битной кодировке *, например, CP1252, тогда вам нужно использовать только '' \ xb6'' и '' \ xfe''. –
Python 3 - это самое чистое решение. –