мне нужно разделить имена столбцов RefSeq
с помощью _
, что происходит до того NM
без разделения той части, которая находится между NM
и числом. Мне нужен вывод, чтобы быть в новом столбце моего ввода.Строка расколу в R в определенном контексте
Пытались что-то вроде: данные
strsplit(as.character(TargetScan$RefSeq),"_")
> head(TargetScan)
Gene miRNA Site cont.score cont.score.perc
1 A1CF hsa-let-7a-5p 8mer-1a -0.051 12
2 A1CF hsa-let-7b-5p 8mer-1a -0.051 12
3 A1CF hsa-let-7c-5p 8mer-1a -0.051 12
4 A1CF hsa-let-7d-5p 8mer-1a -0.062 12
5 A1CF hsa-let-7e-5p 8mer-1a -0.051 12
6 A1CF hsa-let-7f-5p 8mer-1a -0.051 12
RefSeq
1 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
2 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
3 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
4 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
5 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
6 NM_001198820_NM_014576_NM_138932_NM_001198819_NM_001198818_NM_138933
из
> head(TargetScan)
Gene miRNA Site cont.score cont.score.perc
1 A1CF hsa-let-7a-5p 8mer-1a -0.051 12
2 A1CF hsa-let-7b-5p 8mer-1a -0.051 12
3 A1CF hsa-let-7c-5p 8mer-1a -0.051 12
4 A1CF hsa-let-7d-5p 8mer-1a -0.062 12
5 A1CF hsa-let-7e-5p 8mer-1a -0.051 12
6 A1CF hsa-let-7f-5p 8mer-1a -0.051 12
new1 new2 new3 new4 new5 new6
1 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
2 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
3 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
4 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
5 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
6 NM_001198820 NM_014576 NM_138932 NM_001198819 NM_001198818 NM_138933
Быстрое исправление, воспользовавшись очевидным рисунком у вас есть есть: 'strsplit (GSUB ("_ NM", "NM.", Х), "[.]")'. Замените «_», который вы хотите наплевать на «.». и разделить на ".". – AntoniosK