У меня есть файл данных pandas с гетерогенными данными. Это означает, что некоторые столбцы являются поплавками, некоторые являются строками и т. Д.pandas to_excel() с использованием параметра float_format -> ValueError: не удалось преобразовать строку в float
Сначала я попытался форматировать столбцы, вызвав метод xlsxwriter на рабочем листе set_column(), но, похоже, to_excel() форматирует каждую отдельную ячейку со своим собственным форматом объект, поэтому формат на уровне столбца становится переопределенным.
Я пытаюсь экспортировать DataFrame в Excel и использовать параметр float_format, зарегистрированный here.
Код:
writer = pd.ExcelWriter(path, engine='xlsxwriter')
ff = '_(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)'
df.to_excel(writer, "sheet_name", index=False, float_format=ff)
Исключение я получаю после вызова to_excel:
$VE_DIR/lib/python2.7/site-packages/pandas/util/decorators.pyc in wrapper(*args, **kwargs)
58 else:
59 kwargs[new_arg_name] = old_arg_value
---> 60 return func(*args, **kwargs)
61 return wrapper
62 return _deprecate_kwarg
$VE_DIR/lib/python2.7/site-packages/pandas/core/frame.pyc in to_excel(self, excel_writer, sheet_name, na_rep, float_format, columns, header, index, index_label, startrow, startcol, engine, merge_cells, encoding, inf_rep)
1228 formatted_cells = formatter.get_formatted_cells()
1229 excel_writer.write_cells(formatted_cells, sheet_name,
-> 1230 startrow=startrow, startcol=startcol)
1231 if need_save:
1232 excel_writer.save()
$VE_DIR/lib/python2.7/site-packages/pandas/io/excel.pyc in write_cells(self, cells, sheet_name, startrow, startcol)
785 style_dict = {}
786
--> 787 for cell in cells:
788 num_format_str = None
789 if isinstance(cell.val, datetime.datetime):
$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in get_formatted_cells(self)
1729 for cell in itertools.chain(self._format_header(),
1730 self._format_body()):
-> 1731 cell.val = self._format_value(cell.val)
1732 yield cell
1733
$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in _format_value(self, val)
1510 val = self.inf_rep
1511 elif self.float_format is not None:
-> 1512 val = float(self.float_format % val)
1513 return val
1514
ValueError: could not convert string to float: _(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)
Я бы предположил to_excel() будет только попытаться применить параметр всплывать отформатированные столбцов (или даже конкретные ячейки), а не каждой части данных, поэтому я не уверен, что мне не хватает. Если нужно, я отправлю очищенную версию конкретной таблицы, которая воспроизводит ошибку, но я подумал, что, возможно, кто-то узнает, с чем я столкнулся.
Спасибо!
Благодаря @acushner; это было фундаментальное недоразумение ... Я пытаюсь настроить формат с тысячами разделителей, таких как [this] (http://stackoverflow.com/questions/5513615/add-thousands-separators-to-a-number), хотя, и это не узнается. Есть идеи? – HaPsantran
'('{0:,}'. Format (100000000)). Replace (',', '.')' – acushner
Спасибо, но я хочу сделать форматирование в пандах, чтобы поплавок был отформатирован таким образом в полученная таблица. Есть ли способ? – HaPsantran