Мне нужно разобрать файл по строкам по заданным правилам.синтаксический анализ на основе правил
Это требование.
файл может иметь несколько строк с разными данными ..
01200344545143554145556524341232131
1120034454514355414555652434123213101200344545143554145556524341232131
2120034454514
и правила могут быть.
- , если байт [0,1] == "0", а затем извлечь эту строку в /tmp/record0.dat
- , если байт [0,1] == "1", а затем извлечь эту строку/TMP/record1.dat
- если байты [0,1] == «2», а затем извлечь эту строку /tmp/record2.dat
Я ищу для любого языка, который может сделать это в быстром с очень длинным размером файла, например> 2 ГБ.
Цените всю помощь заранее.
Благодаря
Лично я хотел бы сделать это в коде. У меня нет всех ваших правил, но я вижу шаблон, который сделает его тривиальным. –
Если все ваши правила подобны, я считаю, что вам следует сосредоточиться на эффективности ввода-вывода. –
Является ли ваш файл двоичным или содержит простые текстовые данные? – Behrang