У меня есть список, содержащий URL-адреса с экранированными символами. Эти символы были установлены urllib2.urlopen
, когда он восстанавливает HTML страницы:Декодирование экранированных символов по URL
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=edit
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=history
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh
Есть ли способ, чтобы превратить их обратно в немаскированной форму питона?
P.S .: URL-адреса кодируются в UTF-8
на Unquote шоу, как я сказал выше sample.com/index.php?title=\xe9\xa6\x96\xe9\xa1 \ xb5 & action = edi ... может быть, я не очень хорошо себя объяснил в этом случае ... но URL-адрес является китайским, и я хочу его декодировать на его оригинальный символ, а не на unquote. – dyoser
@dyoser Вам нужно поставить это в вашем вопросе. –
@ root45 это комментарий к одному ответу ... так что здесь хорошо. Спасибо за вашу оценку. – dyoser