2015-04-13 2 views
0

Мне нужно преобразовать произвольно большой файл XLSX в TSV. Файл 700MB и следующие подходы потерпели неудачу:Преобразование очень большого файла XLSX в TSV на Mac

Я расстегнул XLSX и довольно распечатал рабочий лист XML, но это не очевидная задача для grep для данных.

Что такое полезное решение для преобразования этого зверя?

(Macbook Air, 4gb RAM, 20GB диск доступен)

+0

Если вы можете конвертировать XLS в цифрах, вы можете экспортировать в CSV, и только партия заменить запятые для вкладок. – Schemetrical

ответ

0

Могу ли я спросить, почему вы должны преобразовать его в ЦВ? Может ли это легче анализировать?

Попытка grep XML-кода не работает, так как данные могут быть разделены на разные XML-файлы (а grepping очень большой файл не работает).

Если ваш файл содержит только основной текст (нет диаграмм, функций ...), вы можете попробовать Spout: https://github.com/box/spout. Файл 700 Мбайт может занять время ожидания (например, часы), но, по крайней мере, он не исчезнет из памяти. Тогда задача будет, если вы хотите открыть этот файл 700мб в Excel или аналогичные, вы можете в конечном итоге сбой Excel, так как файл будет требовать слишком много памяти для загрузки ...

+0

Я хочу TSV, потому что могу grep TSV. Просто попробовал носик.Он пробил через мой 200MB XLSX-файл через 6 часов без сбоев. Однако форматирование было непригодным, даты были сохранены как цифры дат Excel, а не формат. –

0

Вот решение:

  1. установить вино из https://gist.github.com/brendano/22764
  2. приобрести и установить MS Office 2010
  3. не жалуйтесь на шаге 2

Вот некоторые из многих попыток, которые не работают, потому что они: не хватают полезную документацию, выбежали из памяти (в системе 4 Гб ничего еще работает), замораживание и/или производить непригодный выход:

Смежные вопросы