2016-02-18 2 views
2

Я читаю CSVКак пропустить несколько строк в панд

df = pd.read_csv('file_1.csv') 

и получить эту ошибку:

Error tokenizing data. C error: Expected 3 fields in line 196, saw 4 

Так я ставлю:

df = pd.read_csv('file_1.csv',skiprows=196) 

Теперь GE:

Error tokenizing data. C error: Expected 4 fields in line 203, saw 5 

Стараюсь:

df = pd.read_csv('file_1.csv',skiprows=196,203) 

и

df = pd.read_csv('file_1.csv',skiprows=[196,203]) 

Ни работа

Edit.

когда я пытаюсь:

df = pd.read_csv('items_sch_1.csv',skiprows=[196,203]) 

я получил:

Error tokenizing data. C error: Expected 3 fields in line 196, saw 4 
+0

Что значит не работать ... 'skiprows = 196' означает пропустить первые 196 строк,' skiprows = [196,203] 'означает просто пропустить строки 196 и 203 ... Возможно, вам придется посмотреть предварительные строки, обрабатывая ваши данные, чтобы получить соответствующее качество. – AChampion

+0

когда я пытаюсь: df = pd.read_csv ('items_sch_1.csv', skiprows = [196,203]) Я получаю: rror tokenizing data. Ошибка C: Ожидаемые 3 поля в строке 196, видел 4 –

ответ

3

Если вы просто хотите, чтобы пропустить все плохие линии, вы можете загрузить файл CSV с

df = pd.read_csv('file_1.csv', error_bad_lines=False) 

Это будет распечатайте предупреждение для каждой строки, которая пропущена, поэтому вы знаете, сколько ошибок существует.

Смежные вопросы