У меня есть файл 5GB + TSV. Мне нужно визуализировать содержащиеся в нем данные, но Excel не может открыть файл (видимо, слишком большой). Tableau не работает с TSV-файлами, и Access не работает. Я попытался с редактором 010, который может открыть файл, но не экспортировать его в полезном формате. Как я могу открыть/экспортировать/преобразовать его?Как работать с большим TSV-файлом
ответ
Я столкнулся с этой проблемой раньше. Проблема в том, что для открытия файла в Excel вам обычно нужно загрузить весь файл в память. Это нормально, когда файл равен 50 или 500 тыс., Но когда он равен 5 ГБ, система не может загрузить его в память.
Чтобы работать с таким количеством данных, вам действительно нужно загрузить его в базу данных и запустить на нем запросы. Базы данных оптимизированы для работы с большими объемами данных (даже более 5 ГБ).
Трудная часть будет загружать эти данные в базу данных. Вам нужна программа, которая может анализировать ваш файл (читайте по очереди) и вставляйте каждое значение TSV в соответствующий столбец базы данных. Написание приложения для этого может быть лучше. Если вы являетесь пользователем Windows, вы можете использовать C# (http://www.microsoft.com/visualstudio/eng/products/visual-studio-2010-express) и MSSQL Express (http://www.microsoft.com/en-us/download/details.aspx?id=29062). Вот полезный ресурс для синтаксического анализа (Modify CSV Parser to work with TSV files C#). Вот ресурс для вставки строк в MSSQL (How to insert data into SQL Server)
- 1. Как работать с очень большим текстовым файлом?
- 2. Как работать с большим набором ожидающих запросов
- 3. Как заставить WiX работать с большим обновлением?
- 4. Как работать с большим файлом csv
- 5. Как работать с большим размером изображения?
- 6. Как работать с большим деревом mySQL
- 7. Как работать с большим файлом с помощью PHP?
- 8. Как работать с большим шейп-файлом с помощью sharpmap?
- 9. Как работать с большим файлом cookie - Ошибка HTTP 400.
- 10. Как работать с большим количеством файлов и потоков в Node.js?
- 11. Как работать с очень большим 2d-массивом в C++
- 12. Как я могу работать с большим файлом в C#?
- 13. Как работать с очень большим атрибутом «allowed_domains» в scrapy?
- 14. Как работать с большим объектом JSON на Android
- 15. Как работать с большим количеством данных - периодическая таблица и элементы
- 16. Как работать с большим файлом csv в python?
- 17. Попытка работать в листах с большим набором данных
- 18. Просмотр пейджинга с большим количеством изображений, может ли он работать?
- 19. Как работать со слишком большим количеством флеш-файлов?
- 20. Программа перестает работать со слишком большим количеством файлов в массиве
- 21. Корзина с большим картом
- 22. modf() с БОЛЬШИМ НОМЕРАМИ
- 23. as_adjacency_matrix с большим графиком
- 24. Шаблон с большим количеством параметров
- 25. Jsoup с большим XML
- 26. UIScrollView с большим изображением
- 27. MPI_Type_vector с большим размером
- 28. Как работать с большим количеством (тысяч) ярких записей в Laravel 4
- 29. Как работать с большим массивом данных нескольких типов в Snow R?
- 30. Как работать с большим количеством растровых изображений и избегать ошибки: «размер растрового изображения превышает бюджет VM»?
Вы упомянули «TSV-файл» - вы пытались импортировать его в Access после переименования расширения в .txt? – pnuts