2015-02-03 3 views
1

Я получил файл с форматом .dat. Файл имеет 2 ГБ и около 4 миллионов строк. Я попытался открыть с помощью Excel/Notepad/Notepad ++, но ни один из них не смог открыть файл, это всегда ошибка, связанная с памятью (у меня 16 ГБ оперативной памяти). Я также попытался разделить файл с некоторыми приложениями, но ничего.Split .dat большой файл

Что еще я могу сделать?

Большое спасибо!

+1

Что вы хотите с этим делать? Если вы просто хотите просмотреть его, возможно, '' GVim''. – bgeron

+0

На самом деле я хочу открыть в Excel после split. Tks! – RafaelCampos

ответ

0

Я не думаю, что Excel сможет справиться с этим большим количеством данных одновременно, я боюсь. Возможно, вы можете получить доступ к программному обеспечению базы данных, например MS Access: они могут работать с действительно большими наборами данных. Альтернативой является редактор для SQLite. Оба они довольно сложны, чем Excel.

+1

Вот почему я хочу разделить большой файл на более мелкие части. благодаря – RafaelCampos

0

Вы можете разбить файл на строки, используя язык программирования Python 3 (скачать внизу страницы). Пример сценария:

# Your input file name 
filename = r"C:\path\to\input.dat" 
# Your new chunk files will be here. You must keep 
# the {:04}, because it will be replaced by a number. 
chunknametemplate = r"C:\path\to\input-{:04}.dat" 

# Number of bytes for each chunk, set this to something large 
# like 10*1000*1000 (for 10 MB). 
minchunksize = 10*1000*1000 

f = open(filename, 'rb') 

buf = b'' 
chunknum=1 

def writechunk(): 
    global buf, chunknum 
    open(chunknametemplate.format(chunknum), 'wb').write(buf) 
    buf = b'' 
    chunknum += 1 


while True: 
    line = f.readline() 
    if line == b'': 
     break 

    buf += line 
    if len(buf) > minchunksize: 
     writechunk() 

# Write the last chunk 
writechunk() 
Смежные вопросы