Я новичок в работе с большими данными, поэтому, надеюсь, есть простое решение проблемы ниже. Любая помощь будет принята с благодарностью.Извлечение столбцов из большого текстового файла
Я редактировал текстовый файл размером 2 ГБ с помощью EmEditor, который составляет 315 000x1706. Заголовок каждого столбца содержит 1 или 2 случайным образом. Вот небольшая картина того, что у меня есть:
1 2 2 1 1 1 2 1 1 1 1 1 1 2 2 2
AA TT TA CT TT GA TA CT AA CT TT GA CT TT TA TA
AA TT TA CT TT GA TA CT AA CT TT GA CT TT TA TA
AA TT TA CT TT GA TA CT AA CT TT GA CT TT TA TA
(File) (File 1) (File 2)
Мне нужно разбить это на два файла, один только «1» столбцов и другой только с «2» колонки.
Любые предложения о том, как это сделать? Файл слишком большой, чтобы открыть его в excel. Эти данные в конечном итоге окажутся в Matlab. Можно ли это сделать с помощью Matlab?
Спасибо
Вы можете добиться того, что хотите для небольших текстовых файлов? С текстовым файлом вы должны читать его по очереди и обрабатывать. – Daniel
Даже с меньшими файлами я не знаю, с чего начать. – dps2501
Я предполагаю, что есть несколько строк вдоль строк 'AA TT TA CT TT GA TA CT'? Было бы полезно, если бы вы отредактировали вопрос, чтобы предоставить более полный мини-пример того, что находится в файле. – horchler