Как извлечь подстроку ввода?

Как извлечь подстроки из этого входа:Как извлечь подстроку ввода?

input = c("Inspecting sequence ID NM_000775",  
      "Inspecting sequence ID NM_001014975", 
      "Inspecting sequence ID NM_001080484")

получить:

output= c("NM_000775", "NM_001014975", "NM_001080484")

источник

2015-05-19 Paul.jl

'read.table (текст = х) [4]' – rawr

оба работают очень хорошо. Большое спасибо rawr & akrun! –

Вы можете попробовать

sub('.*([A-Z]{2}\\_\\d+)$', '\\1', input) 
#[1] "NM_000775" "NM_001014975" "NM_001080484"

Или, если есть ровно 3 слова следуют пробелами до последней подстроки (для извлечения)

sub('(\\w+\\s+){3}', '', input) 
    #[1] "NM_000775" "NM_001014975" "NM_001080484"

источник

2015-05-19 17:11:00 akrun

Вы можете использовать stringr пакет:

library(stringr) 

unlist(str_extract_all(input, "NM_\\d+")) 
#[1] "NM_000775" "NM_001014975" "NM_001080484"

Как akrun упоминалось, можно также избежать unlist() просто используя str_extract():

str_extract(input, "NM_\\d+") 
#[1] "NM_000775" "NM_001014975" "NM_001080484"

Используемое регулярное выражение, NM_\\d+, будет соответствовать всем, начиная с NM_, за которым следует одна или несколько цифр.

В зависимости от того, NM_ специфичен к примеру, или является представителем вашей конкретной проблемы, вы можете обобщить регулярное выражение [A-Z]{2}_\\d+ или, как akrun упоминалось, \\w+_\\d+.

источник

2015-05-19 17:10:31

@akrun: Замечательно, спасибо за предложения! –

sub("Inspecting sequence ID\\s+","",input) 
[1] "NM_000775" "NM_001014975" "NM_001080484"

источник

2015-05-19 17:11:10 user227710

Попробуйте это:

gsub('.*\\s','',input)

источник

2015-05-19 17:17:46

Обратите внимание, что это будет работать, только если вход гарантирован в формате, указанном в сообщении. Если есть одно конечное пространство, это приведет к удалению нужной части строки. –

Предполагая, что NM является идентификатором х годов запись, другая возможность

gsub(".*\\s*(NM_\\d+)$", "\\1", input)

источник

2015-05-19 20:29:55 gvrocha

Как извлечь подстроку ввода?

ответ

Смежные вопросы