2014-09-29 3 views
6

У меня есть файл на моем рабочем столе, который является файлом HTML. (В chrome, я щелкнул правой кнопкой мыши на веб-странице, выбрал «save-as», а затем «Webpage, HTML»). Как я могу прочитать этот локальный файл в R? Однажды в R мне нужно будет написать некоторые регулярные выражения для синтаксического анализа строк и извлечения определенных значений.Прочитать локальный файл HTML в R

Большое спасибо

+0

Проверить этот пост о [разборе с RegEx] (http://stackoverflow.com/questions/1732348/regex-match-open-tags -except-XHTML-самодостаточный-теги)! –

ответ

10

используют readLines следующим

rawHTML <- paste(readLines("path/to/file.html"), collapse="\n") 
Смежные вопросы