Я пытаюсь получить данные игры из этого site и с помощью пакета XML, чтобы сделать так:readHTMLTable элементы разрушения пролетных
library(XML)
url <- 'http://scores.nbcsports.msnbc.com/cbk/teamstats.asp?team=1115&report=schedule'
raw.schedule <- readHTMLTable(url, which=2)
Проблема заключается в том, что все <span>
элементов в столбце даты HTML рушатся вместе ,
R> raw.schedule$Date[1]
[1] "11/142:30 PM PT3:30 PM MT4:30 PM CT5:30 PM ET10:30 PM GMT6:30 PM 北京时间3:30 PM MST5:30 PM EST"
В идеале я хотел бы иметь только элемент дата сама по себе, такие как:
R> raw.schedule$Date[1]
[1] "11/14"
Я попытался rvest пакет, но я с той же проблемой. Возможно ли прочитать эту таблицу и оставить элементы <span>
разделенными или просто выбрать первый элемент?