Я использую Java, чтобы попытаться разобрать файл. Я ищу людей в документе. Вот примеры, которые я видел до сих пор:regex java parsing
49-летние
31 лет
, 26,
, 45,
30s,
последние тридцатые годы,
В принципе, мне нужно извлечь все люди людей в файл. Я не уверен, что будет правильным выражением регулярных выражений, которое ударит по этим параметрам. Для чисел типа «тридцатые», что лучший способ делать все числовые серии «сороковые», «пятидесятые» и т. Д.?
Возможно, вы используете неправильный инструмент для выполнения этой задачи. Каков ваш успех с указанными выше регулярными выражениями? Я бы предположил, что ', 26,' даст много ложных срабатываний, а также –
Вам нужно проверить пакеты обработки естественного языка. Только Regex может дать вам только кучу случайных чисел. – nhahtdh