У меня есть набор данных с 51 347 строками. При импорте данных с помощью панд и установите разделитель на «|» , Я теряю 394 строки.Pandas пропускает строки при импорте с использованием разделителя = "|"
import pandas as pd
df = pd.read_csv("Basin11.txt", sep='|', error_bad_lines=False,
dtype={'Start Date': str, 'Greater Than/Less Than': str,
'Parameter Code': float, 'Start Time': str, 'Start Depth': float, 'Composite Category': str,
'Composite Type': str})
print(len(df.index))
Если удалить SEP переменных, данные не будут загружаться несколько столбцов, но будут загрузить нужное количество строк. Кажется, это проблема для этого файла. Basin11.txt File
Кто-нибудь знает, почему я теряю данные?
Я бы предположил, что около 394 строк имеют свою колонку со свободным текстом cont обезвреживание | , и error_bad_lines = False игнорировать эти строки – Boud
Я попытался удалить error_bad_lines = False, но это не влияет на длину. Мы удалили каждый из аргументов индивидуально без эффекта, кроме sep = '|'. – Will