извлечения текста из строки в R

У меня есть много строк, которые все ищут подобное, например:извлечения текста из строки в R

x1= "Aaaa_11111_AA_Whatiwant.txt" 
x2= "Bbbb_11111_BBBB_Whatiwanttoo.txt" 
x3= "Ccc_22222_CC_Whatiwa.txt"

Я хотел бы извлечь: WhatiwantWhatiwanttoo, и Whatiwa в R.

Я начал с substring(x1,15,23), но я не знаю, как его обобщить. Как я могу всегда извлекать часть между последними _ и .txt?

Спасибо!

источник

2015-02-26 Iris

Подсказка: регулярные выражения. –

Добавьте тег 'regex', и вы получите ответы в следующие 2 минуты. –

Вы можете использовать regexp группы захвата:

gsub(".*_([^_]*)\\.txt","\\1",x1)

enter image description here

источник

2015-02-26 16:40:02 NicE

как вы строите эту блок-схему? –

с использованием этого (стиль java-script так может быть другим) [http://www.regexplained.co.uk/](http://www.regexplained.co.uk/), множество других сайтов, которые делают то же самое – NicE

спасибо, могу я знать, почему вы используете только. * _ ([^ _] *) \. Txt ", чтобы получить блок-схему, если я использую целую". * _ ([^ _] *) \\. Txt ", «\\ 1», я получаю что-то другое: -p –

Вы также можете использовать библиотеку stringr с Funtions как str_extract (и многие другие возможности) только в случае, если вы не входите в регулярные выражения. Он чрезвычайно прост в использовании

x1= "Aaaa_11111_AA_Whatiwant.txt" 
x2= "Bbbb_11111_BBBB_Whatiwanttoo.txt" 
x3= "Ccc_22222_CC_Whatiwa.txt" 
library(stringr) 
patron <- "(What)[a-z]+" 
str_extract(x1, patron) 
## [1] "Whatiwant" 
str_extract(x2, patron) 
## [1] "Whatiwanttoo" 
str_extract(x3, patron) 
## [1] "Whatiwa"

источник

2015-02-26 17:17:54

извлечения текста из строки в R

ответ

Смежные вопросы