2014-09-05 2 views
1

У меня есть файл данных pandas с гетерогенными данными. Это означает, что некоторые столбцы являются поплавками, некоторые являются строками и т. Д.pandas to_excel() с использованием параметра float_format -> ValueError: не удалось преобразовать строку в float

Сначала я попытался форматировать столбцы, вызвав метод xlsxwriter на рабочем листе set_column(), но, похоже, to_excel() форматирует каждую отдельную ячейку со своим собственным форматом объект, поэтому формат на уровне столбца становится переопределенным.

Я пытаюсь экспортировать DataFrame в Excel и использовать параметр float_format, зарегистрированный here.

Код:

writer = pd.ExcelWriter(path, engine='xlsxwriter') 

ff = '_(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)' 

df.to_excel(writer, "sheet_name", index=False, float_format=ff) 

Исключение я получаю после вызова to_excel:

$VE_DIR/lib/python2.7/site-packages/pandas/util/decorators.pyc in wrapper(*args, **kwargs) 
    58     else: 
    59      kwargs[new_arg_name] = old_arg_value 
---> 60    return func(*args, **kwargs) 
    61   return wrapper 
    62  return _deprecate_kwarg 

$VE_DIR/lib/python2.7/site-packages/pandas/core/frame.pyc in to_excel(self, excel_writer, sheet_name, na_rep, float_format, columns, header, index, index_label, startrow, startcol, engine, merge_cells, encoding, inf_rep) 
    1228   formatted_cells = formatter.get_formatted_cells() 
    1229   excel_writer.write_cells(formatted_cells, sheet_name, 
-> 1230         startrow=startrow, startcol=startcol) 
    1231   if need_save: 
    1232    excel_writer.save() 

$VE_DIR/lib/python2.7/site-packages/pandas/io/excel.pyc in write_cells(self, cells, sheet_name, startrow, startcol) 
    785   style_dict = {} 
    786 
--> 787   for cell in cells: 
    788    num_format_str = None 
    789    if isinstance(cell.val, datetime.datetime): 

$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in get_formatted_cells(self) 
    1729   for cell in itertools.chain(self._format_header(), 
    1730          self._format_body()): 
-> 1731    cell.val = self._format_value(cell.val) 
    1732    yield cell 
    1733 

$VE_DIR/lib/python2.7/site-packages/pandas/core/format.pyc in _format_value(self, val) 
    1510     val = self.inf_rep 
    1511    elif self.float_format is not None: 
-> 1512     val = float(self.float_format % val) 
    1513   return val 
    1514 

ValueError: could not convert string to float: _(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_) 

Я бы предположил to_excel() будет только попытаться применить параметр всплывать отформатированные столбцов (или даже конкретные ячейки), а не каждой части данных, поэтому я не уверен, что мне не хватает. Если нужно, я отправлю очищенную версию конкретной таблицы, которая воспроизводит ошибку, но я подумал, что, возможно, кто-то узнает, с чем я столкнулся.

Спасибо!

ответ

3

Ваш ff полностью недействителен. посмотрите на это:

val = float(self.float_format % val) 

теперь попробуйте это (в IPython или что-то):

'_(* #,##0.00_);_(* (#,##0.00);_(* "-"??_);_(@_)' % 7.2 

вам необходимо использовать формат с плавающей точкой для питона, не превосходят

+1

Благодаря @acushner; это было фундаментальное недоразумение ... Я пытаюсь настроить формат с тысячами разделителей, таких как [this] (http://stackoverflow.com/questions/5513615/add-thousands-separators-to-a-number), хотя, и это не узнается. Есть идеи? – HaPsantran

+0

'('{0:,}'. Format (100000000)). Replace (',', '.')' – acushner

+0

Спасибо, но я хочу сделать форматирование в пандах, чтобы поплавок был отформатирован таким образом в полученная таблица. Есть ли способ? – HaPsantran

Смежные вопросы