Я пытаюсь удалить пробелы, апострофы и двойные кавычки в данных каждого столбца, используя этот циклPandas - как удалить пробелы в каждом столбце в dataframe?
for c in data.columns: data[c] = data[c].str.strip().replace(',', '').replace('\'', '').replace('\"', '').strip()
, но я получаю эту ошибку:
AttributeError: 'Series' object has no attribute 'strip'
данных является кадр данных и был получен из файла excel
xl = pd.ExcelFile('test.xlsx'); data = xl.parse(sheetname='Sheet1')
Я что-то пропустил? Я добавил str
, но это не помогло. Есть лучший способ сделать это.
Я не хочу использовать метки столбцов, например data['column label']
, потому что текст может быть другим. Я хотел бы перебрать каждый столбец и удалить символы, упомянутые выше.
входящие данные:
id city country 1 Ontario Canada 2 Calgary ' Canada' 3 'Vancouver Canada
требуемый выход:
id city country 1 Ontario Canada 2 Calgary Canada 3 Vancouver Canada
[DataFrame.replace()] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.replace.html) – MaxU
@MaxU Я не знаком с пандами, но как бы вы идете об удалении заголовка/конечных пробелов? – medev21
, пожалуйста, отправьте образец набора данных и нужный набор данных (после замены) – MaxU