2010-09-03 3 views
0

Как проверить действительный код html с помощью python? Мне нужна закрытая проверка тегов и фигурные скобки в параметрах тегов. Такие, как | a href = «xxx» | и другие возможные проверки, с которыми я могу пользоваться для libs, я могу использовать для этого?python check html valid

ответ

3

Ну, это не совсем то, что вы ищете, но для проверки HTML для веб-сайта Я работаю над этим, я прошу W3C Validator проверить его для меня, и я просто экранирую вывод, чтобы получить базовый результат «да/нет». Обратите внимание, что в Интернете есть несколько служб проверки достоверности, но W3C работает достаточно хорошо для меня .

#!/usr/bin/python2.6 
import re 
import urllib 
import urllib2 

def validate(URL): 
    validatorURL = "http://validator.w3.org/check?uri=" + \ 
     urllib.quote_plus(URL) 
    opener = urllib2.urlopen(validatorURL) 
    output = opener.read() 
    opener.close() 
    if re.search("This document was successfully checked as".replace(
      " ", r"\s+"), output): 
     print " VALID: ", URL 
    else: 
     print "INVALID: ", URL