На входе у меня есть простой текст (в моем случае обычно это будет HTML) и «спецификация грамматики» (в некотором роде для извлечения данных из обычного текста в структурированные данные), а затем на выходе I необходимо иметь некоторые структурированные данные (JSON в порядке, но, возможно, что-то лучше?)Извлечь структурированные данные из обычного текста
Есть ли библиотеки для этой задачи? Каковы хорошие подходы к определению «грамматической спецификации»? Каковы наилучшие подходы к решению такой проблемы?
С каких пор HTML такой же, как и обычный текст? –
Неясно, есть ли у вас спецификация грамматики или нет. Если да, то какой формат? – fge
@DaDaDom, потому что это простой текст ... что это будет другая история – fge