Я использую Python 3.x. При использовании urllib.request
, чтобы загрузить веб-страницу, я получаю много \n
между ними. Я пытаюсь удалить его, используя методы, указанные в других потоках форума, но я не могу этого сделать. Я использовал функцию strip()
и функцию replace()
... но не повезло! Я запускаю этот код на eclipse. Вот мой код:Удалить новую строку в python с urllib
import urllib.request
#Downloading entire Web Document
def download_page(a):
opener = urllib.request.FancyURLopener({})
try:
open_url = opener.open(a)
page = str(open_url.read())
return page
except:
return""
raw_html = download_page("http://www.zseries.in")
print("Raw HTML = " + raw_html)
#Remove line breaks
raw_html2 = raw_html.replace('\n', '')
print("Raw HTML2 = " + raw_html2)
Я не в состоянии определить, в чем причина получать много \n
в переменной raw_html
.
Возможно, вы получаете '\ r \ n' вместо' \ n'? Вы все равно увидите новую строку, если просто удалите '\ n'. Попробуйте заменить оба. – orange
Я также рисовал '.replace ('\ n', '') .replace ('\ r', '') .replace ('\ t', '')', но это не решило мою проблему! – hnvasa
Я думаю, что они являются буквальными символами '\ n'. –