2016-07-18 4 views
0
sample_text <- ' Ramesh is my frien. He is a very good man' 

Теперь мне нужно, чтобы извлечь все местоимений (PRP или PRP$) из моего текстаИзвлечение местоимения из текста в R

acqTag <- tagPOS(sample_text) 

Я получаю следующее

$POStagged 
[1] "Ramesh/NNP is/VBZ my/PRP$ frien/NN ./. He/PRP is/VBZ a/DT very/RB good/JJ man/NN" 
$POStags 
[1] "NNP" "VBZ" "PRP$" "NN" "." "PRP" "VBZ" "DT" "RB" "JJ" "NN" 

Теперь Как я получить от них местоимения? PRP or PRP$

+1

что-то вроде 'stringr :: str_extract_all (acqTag $ POStagged, "[[: альфа:]]/ПРП")'. Какой пакет 'tagPOS' из ...? –

+0

@BenBolker Я думал то же самое. Я думаю, что это он http://stackoverflow.com/questions/28764056/could-not-find-function-tagpos –

+0

@BenBolker Извините, что приведенный выше синтаксис не дал мне желаемого результата. Кажется, его нужно снова проверить! Благодаря! –

ответ

1

Что именно вы хотите в качестве выхода? Это, кажется, дать то, что я думаю, что вы хотите:

library("stringr") 

prp <- str_extract_all(acqTag$POStagged,"\\w+/PRP\\$?") 
str_replace(unlist(prp), "/PRP\\$?", "") 
#[1] "my" "He" 
+1

Лучше использовать одно регулярное выражение вместо двух '' (\\ w +) (? =/PRP) "' –

+0

@AEBilgrau кажется, что это работает! Благодаря! –

Смежные вопросы