Я только что отредактировал мой вопрос, чтобы сделать его более общим: «Как очистить таблицу, используя r, когда формат не покрыт никакими функциями r?»Скребковые столы не всегда легкие
Прежде всего, как узнать, соответствует ли формат тем функциям, которые функционируют как rvest
?
Во-вторых, допустим, я пробовал все доступные функции скремблирования, и они не сработали, как мне следует продолжить? Напишите функцию разбора самостоятельно? Есть ли более простой способ сделать это?
Если readHTMLTable
не может работать для этого экземпляра, каковы другие варианты, которые я должен преследовать, помимо синтаксического анализа HTML-кода при огромных манипуляциях с строкой?
Чтение FM: пример справки сначала читает документ: 'doc = htmlParse (url); tableNodes = getNodeSet (doc, "// table"); tb = readHTMLTable (tableNodes [[2]]) ' –
Кроме того, это не похоже на таблицу HTML. Можете взглянуть на таблицу, но на самом деле иметь другую структуру. –
Попробуйте прочитать с помощью XML-ориентированных функций. –