Извлечение местоимения из текста в R

sample_text <- ' Ramesh is my frien. He is a very good man'

Теперь мне нужно, чтобы извлечь все местоимений (PRP или PRP$) из моего текстаИзвлечение местоимения из текста в R

acqTag <- tagPOS(sample_text)

Я получаю следующее

$POStagged 
[1] "Ramesh/NNP is/VBZ my/PRP$ frien/NN ./. He/PRP is/VBZ a/DT very/RB good/JJ man/NN" 
$POStags 
[1] "NNP" "VBZ" "PRP$" "NN" "." "PRP" "VBZ" "DT" "RB" "JJ" "NN"

Теперь Как я получить от них местоимения? PRP or PRP$

источник

2016-07-18 Shiva Prakash

что-то вроде 'stringr :: str_extract_all (acqTag $ POStagged, "[[: альфа:]]/ПРП")'. Какой пакет 'tagPOS' из ...? –

@BenBolker Я думал то же самое. Я думаю, что это он http://stackoverflow.com/questions/28764056/could-not-find-function-tagpos –

@BenBolker Извините, что приведенный выше синтаксис не дал мне желаемого результата. Кажется, его нужно снова проверить! Благодаря! –

Что именно вы хотите в качестве выхода? Это, кажется, дать то, что я думаю, что вы хотите:

library("stringr") 

prp <- str_extract_all(acqTag$POStagged,"\\w+/PRP\\$?") 
str_replace(unlist(prp), "/PRP\\$?", "") 
#[1] "my" "He"

источник

2016-07-18 13:07:29

Лучше использовать одно регулярное выражение вместо двух '' (\\ w +) (? =/PRP) "' –

@AEBilgrau кажется, что это работает! Благодаря! –

Извлечение местоимения из текста в R

ответ

Смежные вопросы