import urllib
from urllib.request import urlopen
address='http://www.iitb.ac.in/acadpublic/RunningCourses.jsp?deptcd=EE&year=2012&semester=1'
source= urlopen(address).read()
source=str(source)
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
x=str(data)
if x != ('\r\n\t\t\t\t') or ('\r\n\t\t\t\t\t') or ('\r\n\r\n\t\t\t'):
print("Encountered some data:",x)
parser = MyHTMLParser(strict=False)
parser.feed(source)
Вышеупомянутый код не работает. Он по-прежнему печатает материал «\ r \ n \ t \ t \ t \ t». Какие-либо предложения?Python 3 Специальные символы, ускоряющиеся
Он по-прежнему печати \ г \ п \ t \ t \ t \ t. Я хочу, чтобы он не печатал этот материал. – sgp
@sgp. Вы должны просто проверить 'if not x.strip()', чтобы убедиться, что 'x' не является пробелом – jamylak
@jamylak, вы имеете в виду' if not x.isspace() '? –