Я пытаюсь найти строки слов в корпусе, используя R. Разрешены дизъюнктивные утверждения в grep, например grep («a» или «b» или «c» .. .)? Если это так, как только у меня есть этот подкорпус, как я затем уточню его, чтобы содержать только те примеры, в которых, по крайней мере, два токена исходного условия?Поиск слов в корпусе с помощью R
0
A
ответ
0
Да, вертикальная полоса |
работает как оператор в grep
. Вы можете искать регулярные выражения в R, запустив ?regex
.
Таким образом, чтобы дать пример:
grep("ape|bass|cat", c("monkey", "bass", "catfish"))
[1] 2 3
посовещаться также документацию grep
, grepl
, и что семейство функций. Пакет stringr
предоставляет дополнительные инструменты для обработки текста.
Смежные вопросы
- 1. Эффективный поиск в корпусе
- 2. поиск Веснушка: Поиск с помощью минус-слов
- 3. Поиск слов в предложениях в R
- 4. Поиск нескольких шаблонов (слов) с помощью ack?
- 5. Подсчет незамкнутых слов в корпусе NLTK
- 6. Поиск R corpus для всех слов, оканчивающихся на «esque»
- 7. Поиск определенных ключевых слов с помощью «и:
- 8. Поиск документов с помощью нежелательных слов
- 9. Поиск нескольких слов с помощью jQuery Autocomplete
- 10. Как выполнить поиск слов с помощью LINQ?
- 11. Поиск с помощью нескольких ключевых слов
- 12. поиск ключевых слов с помощью EntityFramework
- 13. Поиск слов с помощью буферизацией чтения
- 14. Алгоритм для удаления слов в корпусе с небольшим появлением
- 15. Как быстро получить коллекцию слов в корпусе (с nltk)?
- 16. Разбиение слов в R
- 17. NLTK Поиск вхождения слова в 5 словах (слева/справа) из контекстных слов в корпусе
- 18. Поиск перекрытия в диапазонах с помощью R
- 19. solr sunspot Точный поиск слов
- 20. Поиск слов с использованием fgetc
- 21. Поиск слов в файле
- 22. Поиск слов в C++
- 23. Поиск слов в предложениях
- 24. Поиск группы слов с использованием регулярных выражений
- 25. Поиск слов в строке
- 26. Поиск слов в массиве?
- 27. R: Разработка данных. Замена слов, содержащих подстроку
- 28. генерации слов в R
- 29. R - сортировка или поиск max() слов в символьной строке
- 30. Могу ли я проверить частоты заданных слов или фраз в кластеризации документов с помощью R?
Вопросы, предлагающие нам ** рекомендовать или найти книгу, инструмент, библиотеку программного обеспечения, учебник или другой ресурс вне сайта **, не относятся к теме для переполнения стека, поскольку они склонны привлекать упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить. –