У меня есть HTML строка (TEMP) следующим образомИспользование GSUB в R
" <span id=\"MainContent_lblGenAssessment\">$138,110</span></dd>"
Я хотел бы использовать GSUB только вернуть $ 138110, без кавычек или пробелов.
До сих пор я сделал
gsub("<.*?>", "", z[temp[3]])
, но это только возвращает
" $138,110"
использовать 'trimws()', чтобы удалить пробелы в начале или в конце строки 'trimws (GSUB ("<.*?>", "", г [темп [3]]))' –
Вы должны дать по запросу для доставки без кавычек, поскольку в результате нет никаких котировочных символов. Эти цитаты являются onlu информативными, и их можно избежать, используя 'cat' или print with' quotes = FALSE'. Посмотрите на функции 'trim', чтобы опубликовать процесс или лучше использовать шаблон типа« ^. + <.*?> |. + $ », Который удалит как стартовый, так и конечный мусор. –
Если вы ожидаете, что HTML еще немного сложнее, чем это, вы должны рассмотреть использование синтаксического анализа XML. –