2016-04-29 5 views
0

Я пытаюсь собрать данные с веб-сайта. У меня есть файл Excel, содержащий все разные расширения для веб-сайта. F.I. www.example.com/example2. У меня есть сценарий, который успешно извлекает HTML с сайта, но теперь я хочу сделать это автоматически для всех расширений. Однако, когда я говорю:Как добавить переменную в URL?

siteExtension = "example2" 
url = ("https://www.example.com/siteExtension") 
r = requests.get(url) 

вместо:

url = ("https://www.example.com/example2") 
r = requests.get(url) 

Я получаю код ошибки. У вас есть какие-либо предложения, как это сделать? Заранее спасибо!

ответ

4

Вам необходимо объединить значение siteExtension в строку url. Вы можете сделать это несколькими способами, но вот два наиболее распространенных:

url = "https://www.example.com/" + siteExtension 

или, тем более повсеместным форма:

url = "https://www.example.com/{}".format(siteExtension) 
+0

Круто спасибо! А что, если я хочу добавить два расширения? Я просто делаю: + siteExtension1 + siteExtension2? – titusflex

+0

Попробуйте и посмотрите, лучший способ узнать. ;) –

0

Вам нужно сцепить строки вместе вместо того, чтобы siteExtension часть вашей строки буквально, как это:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 
0

вы имея эту ошибку, потому что вы не передаете значение из переменной siteExtension к url, вместо этого вы передаете строку siteExtension.

Вы можете исправить это следующим образом:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 

Или используя этот путь:

siteExtension = "example2" 
url = ("https://www.example.com/%s" %(siteExtension)) 
r = requests.get(url) 
Смежные вопросы