Я хотел бы извлечь плакаты из текста и привязать их к карте - автоматически с R. Первым шагом было бы извлечение плакатов.Как извлечь перечисленные имена (имена плагинов) из текста?
Скачан список платак (от geonames); но как я могу совместить слова из списка geonames-placename в тексте?
Возможность с intersect()
работает только при преобразовании текста в вектор - и поэтому нужно разделить текст на слова, что приводит к тому, что оператор-совпадение найдет только однослотовые плакаты, такие как «берлин», но не «новый йорк» и т. д.
Существует ли функция сравнения списка с текстом (как строка)?
MWE:
list = c("Wien", "London", "New York")
text = "Er sah den Stadtplan von Wien in New York."
words = unlist(strsplit(text, "\\W"))
intersect(list, words)
приводит только:
> [1] "Wien"
спасибо! Фактически, ответ, которым вы мне помогли, была команда 'str_extract()'. мой главный момент заключался в получении вывода из 'unlist (str_extract_all (текст, список))' - спасибо! – dia