У меня есть html-файл с именем test.html
у него есть одно слово בדיקה
.Как открыть html-файл?
Я открываю test.html и распечатать его содержимое с помощью этого блока кода:
file = open("test.html", "r")
print file.read()
но печатает ??????
, почему это произошло, и как я могу это исправить?
BTW. когда я открываю текстовый файл, он работает хорошо.
Edit: я попытался это:
>>> import codecs
>>> f = codecs.open("test.html",'r')
>>> print f.read()
?????
Подробнее о unicode, UTF-8 – vks
Вам необходимо открыть файл в формате UTF-8. http://stackoverflow.com/questions/491921/unicode-utf8-reading-and-writing-to-files-in-python –
Если он все еще не работает, просто разместите свою страницу, которую вы пытаетесь обработать. – wenzul