Как написать эти шаблоны?Как написать эти шаблоны?
1) [/ DT $ правительство/NN] имеет/VBZ нет/RB [любой/орган DT/NN] для выпуска/выпуска/VB [новый/JJ долг/N $ обязательства/NNS] of/IN [any/DT kind/NN] [the/DT Treasury/NNP] said/VBD ...
Как получить DT $, VBZ, RB, DT, NN ... или часть между '/' и пробел.
2) Это теги для базы данных Brown. Есть ли шаблон для всех тегов по этой ссылке: http://www.scs.leeds.ac.uk/amalgam/tagsets/brown.html
Могут ли 1) и 2) быть объединены в один шаблон?
Мы не знакомы с регулярным выражением, пожалуйста, помогите. спасибо.
редактировать: 1) Мы хотим, чтобы извлечь часть между/и пространство: , например: Это раздел из корпуса с тегом, мы просто хотим, чтобы извлечь тег, а не слово/маркер. В набор тегов входят заглавные буквы или прописные буквы + $, как показано ниже. Мы хотим получить только теги. Выясняем ли мы вопрос? Правило тег:
прописные буквы или строчные буквы или прописные буквы + $
[/ DT $ правительство/NN] имеет/VBZ не/RB [любой/DT орган/NN] .. .
Как иметь шаблон, который только извлечь DT $, NN, VBZ, RB, DT, NN ..
другими словами, мы должны получить часть между/и пространством.
Мы используем обертку Tperlregex, которая поддерживает большинство функций и шаблонов. Регламент может быть таким же, как/\ w + | $, но мы не знаем.
Мы не знаем, ясно ли мы.
Я не понимаю. Пожалуйста, дайте пример реальной строки ввода и массив результатов, которые вы ожидаете в ответ – SamGoody
Разве вы не должны делать это в Python? – tchrist
На каком языке? Delphi? – kennytm