2016-08-06 6 views
-2

Я читаю csv-файл, используя 'pd.read_csv' и записывая его в другой csv, используя 'file.to_csv'. Это неправильное отображение заголовков в выходном файле. Например,Pandas read_csv неправильно читает заголовки

вход:

ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS 

0 

0 

0 

0 

0 

2993 

сценарий:

data = pd.read_csv(r'filepath/input.csv') 

данные печати

заголовка входного: ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS

Выходной коллектор: ABC | 20151004 | 1900 | 0000000002 | MUPPETS SP 1-10/4, THE | | | R|RS.1

Не знаю, почему он добавляет '.1' до конца некоторые из заголовков.

+2

добавить первые пять строк из CSV-файла здесь. – RAVI

+0

Возможный дубликат http://stackoverflow.com/questions/20845213/how-to-avoid-python-pandas-creating-an-index-in-a-saved-csv – Kartik

+0

Лучший дублирующий вопрос: http: // stackoverflow. com/questions/26786960/pandas-to-csv-first-extra-column-remove-how-to – Kartik

ответ

0

Попробуйте это:

data = pd.read_csv(r'filepath/input.csv',sep='|') 

1 крор, скорее всего, свидетельствует о дубликате столбцов 'RS'

+0

Спасибо. Ты прав. Это большой файл, и я его не заметил. Это дубликат столбца. Есть ли способ прочитать столбец, поскольку он не добавляет '.1' в конце? –

+0

вам нужно добавить некоторые столбцы на вопрос, чтобы решить. Они не похожи на заголовки, а на все его данные. Перед публикацией вопросов вам также необходимо проработать учебник. https://people.duke.edu/~ccc14/sta-663/IntroductionToPythonSolutions.html – Merlin

Смежные вопросы