2010-11-11 3 views
0

Как написать эти шаблоны?Как написать эти шаблоны?

1) [/ DT $ правительство/NN] имеет/VBZ нет/RB [любой/орган DT/NN] для выпуска/выпуска/VB [новый/JJ долг/N $ обязательства/NNS] of/IN [any/DT kind/NN] [the/DT Treasury/NNP] said/VBD ...

Как получить DT $, VBZ, RB, DT, NN ... или часть между '/' и пробел.

2) Это теги для базы данных Brown. Есть ли шаблон для всех тегов по этой ссылке: http://www.scs.leeds.ac.uk/amalgam/tagsets/brown.html

Могут ли 1) и 2) быть объединены в один шаблон?

Мы не знакомы с регулярным выражением, пожалуйста, помогите. спасибо.

редактировать: 1) Мы хотим, чтобы извлечь часть между/и пространство: , например: Это раздел из корпуса с тегом, мы просто хотим, чтобы извлечь тег, а не слово/маркер. В набор тегов входят заглавные буквы или прописные буквы + $, как показано ниже. Мы хотим получить только теги. Выясняем ли мы вопрос? Правило тег:

прописные буквы или строчные буквы или прописные буквы + $

[/ DT $ правительство/NN] имеет/VBZ не/RB [любой/DT орган/NN] .. .

Как иметь шаблон, который только извлечь DT $, NN, VBZ, RB, DT, NN ..

другими словами, мы должны получить часть между/и пространством.

Мы используем обертку Tperlregex, которая поддерживает большинство функций и шаблонов. Регламент может быть таким же, как/\ w + | $, но мы не знаем.

Мы не знаем, ясно ли мы.

+0

Я не понимаю. Пожалуйста, дайте пример реальной строки ввода и массив результатов, которые вы ожидаете в ответ – SamGoody

+0

Разве вы не должны делать это в Python? – tchrist

+0

На каком языке? Delphi? – kennytm

ответ

0

Я думаю, вы должны использовать это: «/ [A-Z] + \ $? \". (без qoutes, конечно)

+0

Спасибо, альфа-мышь. – Dylan

+0

И как насчет этого: "/ [A-Z] + \ $ *" или "/ \ w + \ $ *". – Dylan

+0

И это: «/ [A-Z] + \ $ {0-2}», имеющее 1, 2 или не $ – Dylan

Смежные вопросы