Да, это просто еще один вопрос «как очистить». Извините за это, но я прочитал предыдущие ответы и руководство для rvest
.r rvest webscraping hltv
Я делаю веб-соскабливание для своей домашней работы (поэтому я не планирую использовать данные для какой-либо коммерческой проблемы). Идея состоит в том, чтобы показать, что среднее умение команды влияет на индивидуальное умение. Я пытаюсь использовать данные CS: GO из HLTV.org.
Информация доступна на http://www.hltv.org/?pageid=173&playerid=9216
мне нужны две таблицы: Keystats (только данные) и игроков (данные и URL-адресов). Я пытаюсь использовать селектор CSS, созданный с помощью SelectorGadget, и также попытался проанализировать исходный код веб-страницы. Я потерпел неудачу. Я делаю следующее:
library(rvest)
library(dplyr)
url <- 'http://www.hltv.org/?pageid=173&playerid=9216'
info <- html_session(url) %>% read_html()
info %>% html_node('.covSmallHeadline') %>% html_text()
Не могли бы вы рассказать мне, что это правильный селектор CSS?
Допускает ли этот сайт автоматизированного выскабливания? – GGamba