2015-09-07 2 views
0

Я пытаюсь найти строки слов в корпусе, используя R. Разрешены дизъюнктивные утверждения в grep, например grep («a» или «b» или «c» .. .)? Если это так, как только у меня есть этот подкорпус, как я затем уточню его, чтобы содержать только те примеры, в которых, по крайней мере, два токена исходного условия?Поиск слов в корпусе с помощью R

+1

Вопросы, предлагающие нам ** рекомендовать или найти книгу, инструмент, библиотеку программного обеспечения, учебник или другой ресурс вне сайта **, не относятся к теме для переполнения стека, поскольку они склонны привлекать упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить. –

ответ

0

Да, вертикальная полоса | работает как оператор в grep. Вы можете искать регулярные выражения в R, запустив ?regex.

Таким образом, чтобы дать пример:

grep("ape|bass|cat", c("monkey", "bass", "catfish")) 
[1] 2 3 

посовещаться также документацию grep, grepl, и что семейство функций. Пакет stringr предоставляет дополнительные инструменты для обработки текста.

Смежные вопросы