Я знаю, как использовать методы Pandas.Series.str.contains()
для проверки наличия подстроки в другой подстроке.Pandas: Как проверить, содержат ли первые «n» элементы строки подстроку?
Однако, мне интересно, как мы можем проверить, содержат ли первые «n» элементы Pandas Series.str, содержащую подстроку?
Вот пример некоторых гликан я работаю с:
Neu5Aca2-6Galb1-4GlcNAcb1-3Galb1-4GlcNAcb1-6(Galb1-3)GalNAca-Sp14
Neu5Aca2-6(Neu5Aca2-3Galb1-3)GalNAca-Sp14
Neu5Aca2-3Galb1-4GlcNAcb1-2Mana1-6(Neu5Aca2-6Galb1-4GlcNAcb1-2Mana1-3)Manb1-4GlcNAcb1-4GlcNAcb-Sp12
GalNAca1-3(Fuca1-2)Galb1-3GalNAca1-3(Fuca1-2)Galb1-4GlcNAcb-Sp0
я в настоящее время делаю str.contains()
, чтобы проверить, происходит ли a(2-3)
или a(2-6)
в имени, но третий пример один, где a2-6
происходит как в начало и посередине.
Моя цель - выделить подстроку a2-3
с первых n
букв в каждой строке. Это возможно?
Вы также можете использовать стандартную строку например, '.str [: 10]', но это то же самое. – DSM