2016-03-10 3 views
2

Я изо всех сил пытаюсь получить кусок данных, используя rvest. Часть данных, которую я ищу, - это значение 20960, которое находится внутриOpenView (20960). Как мне это сделать с помощью rvest?Захват onclick с rvest

Пример разделе HTML я работаю с является

<tr class="row-1" align="left"> 
<td style="width:120px;"> 
<a href="#" onclick='OpenView(20960);return false;'> 
BAKER, JAIME EDWARD</a> 
</td> 
</tr> 
+2

Какой код вы пробовали? Не можете ли вы извлечь атрибут onclick? – MrFlick

+0

Добро пожаловать в переполнение стека! Пожалуйста, прочитайте информацию о [как задать хороший вопрос] (http://stackoverflow.com/help/how-to-ask) и как дать [воспроизводимый пример] (http://stackoverflow.com/questions/ 5963269). Это облегчит вам помощь другим людям. – zx8754

ответ

2

Я думаю, что это требует немного ...

оглавлению
library("rvest") 
library("stringr") 
read_html('<tr class="row-1" align="left"> 
<td style="width:120px;"> 
      <a href="#" onclick=\'OpenView(20960);return false;\'> 
      BAKER, JAIME EDWARD</a> 
      </td> 
      </tr>') %>% 
    html_nodes("a") %>% 
    html_attr("onclick") %>% 
    str_extract("(?<=\\().*(?=\\))") %>% # returns the stuff inside the parens 
    str_trim(side="both")     # trims whitespace from both sides 
    [1] "20960" 
+0

Это работает. Я не думал, что вам нужно сделать grepping после html_attr. Я все еще немного новичок в этом. Спасибо, что научили меня чему-то новому и ответили на мой вопрос. Очень признателен. – thatsawinner

Смежные вопросы