2017-02-08 2 views
1

Я пытаюсь скрести текстовый элемент со следующего сайта: http://www.fangraphs.com/statss.aspx?playerid=639&position=3B
деталь я хочу, чтобы очистить это «3В» от следует «Position:» в верхней части веб-страницы. Моя попытка ниже создает пустой набор данных aka:
character(0)Зачистка текст с rvest

Любая помощь приветствуется. Благодарю.

library(rvest) 
url="http://www.fangraphs.com/statss.aspx?playerid=10155&position=3B"  
ret <- url %>% 
    read_html() %>% 
    html_nodes(xpath='//*[@id="content"]/table[1]/tbody/tr/td[1]/table/tbody/tr[1]/td/div[2]/text()[4]') %>% 
    html_text() 

ret 

ответ

1

Используйте этот xpath: //*[@id="content"]/table[1]/tr/td[1]/table/tr[1]/td/div[2]/text()[5] Это в основном так же, как ваша, за исключением того, что она исключает tbody теги -не уверен, почему, не могу найти его documented- и изменения последнего индекса до 5.

Результат для playerid=639: " 3B"

(добавить %>% trimws() в конце, чтобы получить "3B")

+0

@g гамба Спасибо! Хотелось бы, чтобы я знал, что проблема копировала этот xpath для будущего. –

Смежные вопросы