Я пытаюсь очистить таблицу html, используя lxml.html.clean.Cleaner(). Мне нужно разделить атрибуты javascript, но хотелось бы сохранить встроенный CSS-стиль. Я думал, что стиль = False установка по умолчанию:Как сохранить встроенный стиль CSS с помощью lxml.html.clean.Cleaner() в Python?
import lxml.html.clean
cleaner = lxml.html.clean.Cleaner()
Однако, когда я называю cleaner.clean_html(doc)
<span style="color:#008800;">67.51</span>
станет
<span>67.51</span>
В принципе, стиль не сохраняется. Я пыталась добавить:
cleaner.style= False
Это не поможет.
Обновление: Я использую Python 2.6.6 + lxml 3.2.4 на Dreamhost и Python 2.7.5 + lxml 3.2.4 на локальном Macbook. Те же результаты. Другое дело: есть атрибут Javacript связанных в моем HTML:
<td style="cursor:pointer;">Ticker</td>
Может быть LXML раздел это связанное Javacript стиля и лечение другим стилей то же самое? Надеюсь нет.
Спасибо за понимание!
Какие версии Python и LXML вы используете? – mzjn
Привет, mzjn, спасибо за ваш комментарий! См. Обновления. – laviex