2010-03-04 6 views
1

У меня есть следующие функцииLXML или Xpath печать содержание

def parseTitle(self, post): 
    """ 
     Returns title string with spaces replaced by dots 
    ""   
    return post.xpath('h2')[0].text.replace('.', ' ') 

Я хотел бы видеть содержание post. Я пробовал все, что мог придумать.

Как правильно отладить содержимое? Это сайт фильмов, где я разорвал ссылки и название, и эта функция должна анализировать название.

Я уверен, что H @ не существует, как я могу распечатать/отладить это?

+0

Что содержит сообщение? – Mark

ответ

2

post - это элемент дерева элементов xml, не так ли? так первый, вы можете попробовать:

# import lxml.html # if not yet imported 
# (or you can use lxml.etree instead of lxml.html) 
print lxml.html.tostring(post) 

, если нет, то вы должны создать элемент объекта дерева из него

post = lxml.html.fromstring(post) 

или, может быть, проблема заключается только, что вы должны заменить h2 с //h2?

ваш вопрос не очень пояснительный.

Смежные вопросы