2017-02-02 6 views
0

, поэтому я читаю CSV-файл, а затем сохраняю только определенные столбцы и переписывая файл. Я имею в виду, что один столбец (например, ColumnA) имеет свои значения в двойных кавычках. Есть ли простой способ для меня выполнить эту задачу, а также удалить эти двойные кавычки?Удалите двойные кавычки в python pandas для значений всех столбцов

a = pd.read_csv(filename,low_memory=False) 

a1 = a[['ColumnA','ColumnB']] 

a1.to_csv('filelocation') 
+0

попробовать 'пеленгации [ 'Columna'] = D [ 'Columna'] str.replace ('"', '') ' – EdChum

+1

Можете ли вы опубликовать образец необработанных данных, также если вы только собираетесь загружать эти столбцы, вы можете указать это в 'read_csv':' a = pd.read_csv (filename, usecols = ['ColumnA', 'ColumnB']) ' – EdChum

+0

Я добавил эту строку до« a1 = .. . ", но это не сработало ... –

ответ

1

можно подавить с помощью процитировать csv.QUOTE_NONE:

import csv 
pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \ 
    .to_csv(new_file_name, quoting=csv.QUOTE_NONE, index=False) 

но это лучше (безопаснее), чтобы выбрать другой разделитель (тот, который не встречается в ColumnA колонке), так что вы не будете есть проблемы в будущем, когда вы будете читать/разобрать, что новый CSV файл:.

pd.read_csv(filename,usecols=['ColumnA','ColumnB']) \ 
    .to_csv(new_file_name, sep=';', index=False) 
Смежные вопросы