2013-07-15 7 views
26

В this post есть пример Python для преобразования из csv в xls.Python convert csv to xlsx

Однако мой файл имеет более 65536 строк, поэтому xls не работает. Если я назову файл xlsx, это не изменит ситуацию. Есть ли пакет Python для преобразования в xlsx?

ответ

46

Вот пример использования xlsxwriter:

import os 
import glob 
import csv 
from xlsxwriter.workbook import Workbook 


for csvfile in glob.glob(os.path.join('.', '*.csv')): 
    workbook = Workbook(csvfile[:-4] + '.xlsx') 
    worksheet = workbook.add_worksheet() 
    with open(csvfile, 'rt', encoding='utf8') as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       worksheet.write(r, c, col) 
    workbook.close() 

FYI, есть также пакет под названием openpyxl, который может читать/писать Excel 2007 XLSX файлы/XLSM.

Надеюсь, что это поможет.

+0

Благодарим за этот очень полезный фрагмент кода. При использовании больших файлов лучше использовать «constant_memory» для использования контролируемой памяти, например: 'workbook = Workbook (csvfile + '.xlsx', {'constant_memory': True})'. Ссылка: http://xlsxwriter.readthedocs.org/ru/latest/working_with_memory.html – Ethan

+1

Nice ... Однако созданные файлы xlsx полны всех числовых полей с ошибками, которые хранятся в виде текста вместо цифр. . – MrMobileMan

+1

Нашел исправление для чисел в виде текста: http://stackoverflow.com/questions/24971556/openpyxl-python-writing-csv-to-excel-gives-number-formatted-as-text – MrMobileMan

17

С моей библиотеке pyexcel, вы можете сделать это в одной командной строке:

from pyexcel.cookbook import merge_all_to_a_book 
import pyexcel.ext.xlsx # needed to support xlsx format, pip install pyexcel-xlsx 
import glob 


merge_all_to_a_book(glob.glob("your_csv_directory/*.csv"), "output.xlsx") 

Каждый CSV будет иметь свой собственный лист и название будет их имя файла.

+1

Очень приятно ... Спасибо! Я проголосовал за это. Одна из проблем, которые возникают у меня, заключается в том, что и это, и xlswriter создают полные ошибки xlsx, которые текстовые поля отформатированы как текст вместо цифр ... – MrMobileMan

+1

Найденное исправление чисел в виде текста здесь ... http: //переполнение стека.com/questions/24971556/openpyxl-python-writing-csv-to-excel-дает-number-format-as-text – MrMobileMan

+0

Если требуется дополнительное форматирование, вы можете не использовать merge_all_to_a_book, а использовать pyexcel.Sheet, с помощью которого вы можете использовать format(), чтобы [конвертировать float в int] (https://github.com/chfw/pyexcel/issues/18), затем используйте [операции с листами] (http://pyexcel.readthedocs.org/en/latest /tutorial04.html), чтобы объединить их и сохранить как csv. – chfw

2

Как это сделать с openpyxl Lib:

import csv 
from openpyxl import Workbook 

def convert_csv_to_xlsx(self): 
    wb = Workbook() 
    sheet = wb.active 

    CSV_SEPARATOR = "#" 

    with open("my_file.csv" as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       for idx, val in enumerate(col.split(CSV_SEPARATOR)): 
        cell = sheet.cell(row=r+1, column=idx+1) 
        cell.value = val 

    wb.save("my_file.xlsx") 
0
from openpyxl import Workbook 
import csv 


wb = Workbook() 
ws = wb.active 
with open('test.csv', 'r') as f: 
    for row in csv.reader(f): 
     ws.append(row) 
wb.save('name.xlsx') 
0

Существует простой способ

import os 
import csv 
import sys 

from openpyxl import Workbook 

reload(sys) 
sys.setdefaultencoding('utf8') 

if __name__ == '__main__': 
    workbook = Workbook() 
    worksheet = workbook.active 
    with open('input.csv', 'r') as f: 
     reader = csv.reader(f) 
     for r, row in enumerate(reader): 
      for c, col in enumerate(row): 
       for idx, val in enumerate(col.split(',')): 
        cell = worksheet.cell(row=r+1, column=c+1) 
        cell.value = val 
    workbook.save('output.xlsx') 
1

Добавление ответа, который только использует библиотеку панд, чтобы читать в. csv и сохранить файл .xlsx. В этом примере используются pandas.read_csv (Link to docs) и pandas.dataframe.to_excel (Link to docs).

Полностью воспроизводимый пример использует numpy для генерации случайных чисел, и это можно удалить, если вы хотите использовать свой собственный CSV-файл.

import pandas as pd 
import numpy as np 

# Creating a dataframe and saving as test.csv in current directory 
df = pd.DataFrame(np.random.randn(100000, 3), columns=list('ABC')) 
df.to_csv('test.csv', index = False) 

# Reading in test.csv and saving as test.xlsx 

df_new = pd.read_csv('test.csv') 
writer = pd.ExcelWriter('test.xlsx') 
df_new.to_excel(writer, index = False) 
writer.save()