У меня есть огромный файл, где большинство строк давно, но есть несколько строк, которые всего несколько слов:Как конкатенировать линии, соответствующие шаблону?
Here is a long sentence. This is a short line. Here is a long sentence. Here is a long sentence. This is another short line. Here is a long sentence.
Все короткие строки начинаются с уникальными словами. В этом примере короткие строки начинаются с «This» и заканчиваются на «line». И они охватывают ровно столько же строк. Мне нужна команда, которая будет конкатенировать только короткие строки в файле, так что я получаю
Here is a long sentence. This is a short line. Here is a long sentence. Here is a long sentence. This is another short line. Here is a long sentence.
Есть ли команда, которая будет делать эту работу? Я не хочу писать программу сценария, если мне не нужно ...
Спасибо.
Может "длинные" линии определенно не начинаются с "это"? –
Когда вы говорите «Все короткие строки начинаются с уникальных слов». Вместо этого вы подразумеваете «Все короткие строки начинаются с одного слова»? Вам нужно разместить более представительный ввод и ожидаемый результат. –
Пожалуйста, попробуйте этот модуль [разделить английские предложения] (http://search.cpan.org/~shlomoy/Lingua-EN-Sentence-0.25/lib/Lingua/EN/Sentence.pm) –