Я довольно новичок в R, и у меня возникают проблемы с извлечением данных с сайта Forbes.Scrape Anchored Website with Selenium Package in R
Моя текущая функция:
URL =
http://www.forbes.com/global2000/list/#page:1_sort:0_direction:asc_search:_filter:All%20industries_filter:All%20countries_filter:All%20states
данных = readHTMLTable (URL)
Однако сайт Forbes якорь с символом "#" в ссылке. Я загрузил пакет rselenium для анализа данных, которые я хочу, но я не очень хорошо разбираюсь в reselenium.
Есть ли у кого-нибудь совет/экспертиза с reselenium и как я могу извлечь данные из Forbes, используя reselenium? В идеале я хочу извлечь данные со страницы 1, 2 и т. Д. С веб-сайта.
Спасибо!
Эй, Кори. Функция работает в той степени, в которой вы смотрите только на страницу 1 (см. «#page: 1» в ссылке). Однако, как только вы захотите перейти на страницу 2, то есть «#page: 2», функция не работает, поскольку она продолжает извлекать данные со страницы 1 из-за привязки. Вы можете думать о любой работе вокруг вас? –