2016-03-06 1 views
0

Я пытаюсь разобрать некоторый HTML-код и затем записать этот HTML-файл в файл .py. Вот код, я использую:Как разобрать HTML, а затем записать его в .py-файл

from html.parser import HTMLParser 

class MyHTMLParser(HTMLParser): 
    def handle_data(self, data): 
     print(data) 
     f = open('/Users/austinhitt/Desktop/Test.py', 'w') 
     f = open('/Users/austinhitt/Desktop/Test.py', 'r') 
     t = f.read() 
     f = open('/Users/austinhitt/Desktop/Test.py', 'w') 
     f.write(t + '\n' + data) 
     f.close() 

parser = MyHTMLParser() 
parser.feed('<html>' 
      '<body>' 
      '<p>import time as t</p>' 
      '<p>from os import path</p>' 
      '<p>import os</p>' 
      '</body>' 
      '</html>') 

Я не получаю сообщение об ошибке, однако только содержимое последнего р тега кладутся в файл. Мне нужно только то, что внутри тегов p, которые нужно добавить в файл, а не сам тег p. Мне нужно содержимое каждого p-тега, добавленного в файл, и я не хочу использовать BeautifulSoup или другие не встроенные модули. Я использую Python 3.5.1

ответ

0

Кажется, что вы прочитали файл «Test.py» после использования режима «запись», который может привести к потере данных.

+0

Да! Кажется, это работает! Спасибо! – HittmanA

Смежные вопросы