Я пытаюсь проанализировать вывод статистической программы (Mplus) с использованием Python.Анализ выходных программ на основе базы данных с использованием Python
Формат вывода (example here) структурирован в блоках, подблоках, столбцах и т. Д., Где пробелы и разрывы очень важны. В зависимости от, например, запрашиваемые параметры, вы получаете дополнительный (дополнительный) блок или столбец здесь или там.
Приближение этого с использованием регулярных выражений было PITA и полностью не поддавалось контролю. Я рассматривал парсеров как более надежное решение, но
- Я немного overwhelmed всеми возможными инструментами и подходами;
- создается впечатление, что они не очень подходят для такого вывода.
E.g. LEPL имеет что-то по имени line-aware parsing, которое, кажется, идет в правильном направлении (пробелы, блоки, ...), но по-прежнему ориентировано на синтаксический анализ синтаксического анализа, а не на вывод.
Предложение, в каком направлении смотреть будет оценено.