Рассмотрим следующую строку, представляющую собой таблицу содержимого, извлеченную из pdf, как в следующем примере, две темы могут быть в одной строке, есть один разрыв строки в конце каждая строка (как в примере)Извлечь данные из одной большой строки с помощью регулярного выражения
A — N° 1 2 janvier 2013
TABLE OF CONTENT
Topic à one ......... 30 Second Topic .......... 33
Third - one ......... 3 Topic.with.dots .......... 33
One more line ......................... 27 last topic ...... 34
Я хочу, чтобы извлечь название «тема на один» в разделе, в «Вторая тема», «Третий -он», «Topic.with.dots», «еще один line 'и' last topic '
Любые идеи для соответствующего регулярного выражения?
Кого вы можете использовать в регулярном выражении? Всегда добавляйте соответствующий тег к любому запросу регулярного выражения. Благодаря! –
Какие символы разрешены в имени раздела? –
@Tim Я использую Ruby 2 – denisjacquemin