Мне нужно разобрать кучу неформатированного текста, аналогичного приведенному ниже.Как использовать регулярный текст синтаксического разбора с символом «|»
те | DT | O считается | VBN | O анархисты | NNS | O при | IN | O лучшей | JJs | O доли | NN | O | ДТ | O некоторые | JJ | O семья | NN | O сходство | NN | O | | O «| RQU | O
мне нужно использовать регулярное выражение для разбора данных в формат, который будет выглядеть так:..
ДТ I -MISC
определенные JJ O
в IN O
ДТ B
фунт NN I
Что именно формат вы ищете? Какое разграничение вы пытаетесь использовать? Разделять пробелами, «|», по .... и т. Д.? –
отдельно пробелом – Anoonymonus
, тогда регулярное выражение полностью переборщило. Просто используйте метод «split», и все готово. Вы уверены, что вы также не пытаетесь захватить «|» ... похоже, что это так? –