Я работаю с текстовым файлом с более чем 1000 документами внутри. Большая часть документа очень похожа, начиная и заканчивая одним макетом. Я пытаюсь разделить текст в массиве, и каждый элемент будет документом:Использование регулярных выражений для разграничения текста
let documents = [
[], <- doc1
[], <- doc2
....
];
Для достижения этой цели я использую гигантское регулярное выражение, что получить общее количество страниц документа (у меня есть эта информация на первой странице) и занимает все =>[\s\S]*?
< = до последней страницы. не работает очень хорошо, потому что некоторые документы могут не иметь последней страницы, так что ловить два документа вместо одного.
Здесь регулярное выражение догоняет две документы, но если вы удалите Z6: 0 и будет видеть проблему.
Можно ли исправить это?
Спасибо.
'text.split (/^(? =, Ministério)/м)' должна работать достаточно хорошо для образца текста вы публикуемую. – Tomalak
http://regexr.com/3dk5d Это вызывает бесконечность. Можете ли вы показать мне рабочий пример? –
Не проверяйте это с помощью регулярного выражения. Это выражение, специально предназначенное для разделения вашей строки. Он ничего не соответствует. – Tomalak