2014-11-03 3 views
-1

«представленный 1 год назад от bagelpirate к/г/книги»Удаление определенной части строки в Python

В основном я учусь о веб выскабливание, и я вытащил эту информацию из HTML страницы Reddit. Мне нужно получить «бублинг» из этой строки. Есть ли способ сделать это в python?

+0

ли вы имеете в виду вы хотите строку «bagelpirate», или вы имеете в виду вы хотите, чтобы избавиться от «bagelpirate» и оставить все остальное? – khelwood

+0

Да! Есть ли способ пойти, чтобы удалить все, прежде чем «by» и после «to r/books», – prisonbreakx

ответ

0

Учитывая начальная строка:

s = "submitted 1 year ago by bagelpirate to /r/books" 

Вы можете сделать это следующим образом (нахождение позиции предыдущих и следующих подстрок):

name = s[s.index(' by ')+4:s.index(' to /r/books')] 

Или вы можете использовать обычный выражение:

import re 

name = re.search(' by (.+) to /r/books', s).group(1) 

Это означает «найти» (что-то) в/r/books »в строке и дать мне часть, обозначенную круглыми скобками».

Это отчасти зависит именно формат строки вы получаете на самом деле собирается быть.

0
In [84]: s = "submitted 1 year ago by bagelpirate to /r/books" 

In [85]: s.replace("bagelpirate", '') 
Out[85]: 'submitted 1 year ago by to /r/books' 
Смежные вопросы