2017-02-13 15 views
0

У меня есть файл csv, который содержит теги html. Я пытаюсь выполнить итерацию через DataFrame, чтобы удалить теги html, используя следующую функцию, и я получаю «TypeError: ожидаемая строка или буфер». Любая помощь по этой ошибке будет принята с благодарностью.Удаление HTML-тегов из Python DataFrame

import re 

def clean_html(raw_html): 
    for index, row in raw_html.iterrows(): 
     cleanr = re.compile('<.*?>') 
     cleantext = re.sub(cleanr, '', raw_html) 
     return cleantext 

ответ

0

Вы передаете переменную raw_html функции re.sub. Попробуйте передать данные строки.

cleantext = re.sub(clean, '', row['a1']) 
Смежные вопросы