2015-10-08 2 views
-1

Я ищу способы использования подстановочных знаков в качестве части критериев удаления для части корпуса. Я не смог найти что-либо в SO или google, связанных с этой проблемой.Удаление фраз с использованием подстановочных знаков

Цель: анализ большого набора стандартных заметок, в котором вклад сотрудников разбит на разделы текста.

Пример данные:

***Date; Area: asdfwerqw Detail: xxxxx Requested Action: xxxxxx Assigned to: John Doe

Порция для извлечения для анализа:

Detail:xxxxx Requested Action:xxxxxx

Количество деталей перед Деталь может быть больше. Кроме того, Assigned to: может не отображаться.

ответ

0

Трудно сказать без большего количества примеров и деталей, но вы, вероятно, хотите использовать регулярные выражения с положительным опережающим просмотром и дополнительными элементами:

library(stringr) 

text <- c("***Date; Area: asdfwerqw Detail: xxxxx Requested Action: xxxxxx Assigned to: John Doe") 

str_extract_all(text, c("Detail(.*?)(?=Requested Action:)", "Requested Action:((.*?)(?=Assigned to:))?")) 

# [[1]] 
# [1] "Detail: xxxxx " 
# 
# [[2]] 
# [1] "Requested Action: xxxxxx " 
+0

Спасибо, я думаю, что это именно то, что мне нужно. – user2344226

Смежные вопросы