У меня есть список адресов следующим образом:Strip случайных символов из URL
urls = [
www.example.com?search?q=Term&page=0,
www.example.com?search?q=Term&page=1,
www.example.com?search?q=Term&page=2
]
Где срок может быть любой термин, который мы хотим: Europe
, London
и т.д ..
Моя часть кода (в том числе весь код) состоит в следующем:
for url in urls:
file_name = url.replace('http://www.example.com/search?q=','').replace('=','').replace('&','')
file_name = file_name+('.html')
что приводит:
Termpage0.html
Termpage1.html
and so on..
Как я могу лишить срок в списке адресов, чтобы привести как:
page0.html
page1.html
and so on?
Термин случайный. Не может быть Термином всегда. ;) –
+1 за re.sub, потому что я этого не знал. Тем не менее, термин не жестко закодирован, так как я предполагаю, что вы неправильно поняли вопрос. Моя программа запрашивает у пользователя «Термин», который может быть тем, что мы хотим, и началом результатов поиска (от 0 до n). Затем я сохраняю все html-файлы на диске. –