У меня есть форма данных pandas формы (455698, 62). Я хочу сохранить его как файл csv и загрузить его позже с помощью pandas. Сейчас я делаю это:Сохранение как csv corrupts dataframe
df.to_csv("/path/to/file.csv",index=False,sep="\\", encoding='utf-8') #saving
df=pd.read_csv("/path/to/file.csv",delimiter="\\",encoding ='utf-8') #loading
и я получаю dataframe с формой (455700, 62): 2 больше строк? Когда я подробно проверяю (глядя на все уникальные значения в каждом столбце), я обнаружил, что некоторые значения изменяли столбцы в процессе.
Я пробовал несколько разделителей, заставляя dtype = «объект», и я не могу понять, где ошибка. Что я должен попробовать?
Вам необходимо отправить исходные данные, воспроизводящие это, также вы можете найти то, что дополнительные столбцы. Вы можете сохранить начальные столбцы как 'first_cols = df.columns', затем загрузить df и сравнить' second_cols = other_df.columns', а затем сделать 'first_cols.difference (second_cols)' – EdChum
очень маленький проблеск данных. отлично, чтобы иметь идею ... – fedepad
это дополнительные строки, а не дополнительные столбцы. Я не думаю, что могу опубликовать необработанные данные, поскольку он очень большой, и я не знаю, где проблема (IMO это только одна или две строки, которые вызывают эту проблему) – CoMartel