Я пытаюсь получить некоторые данные о зарплате от the Feds Data Center. Есть 1537 записей для чтения. Я думал, что получил таблицу xpath с Chrome Inspect
. Однако мой код возвращает только заголовок. Я хотел бы знать, что я делаю неправильно.Скребок данныхТаблица получает только заголовок
library(rvest)
url1 = 'http://www.fedsdatacenter.com/federal-pay-rates/index.php?n=&l=&a=CONSUMER+FINANCIAL+PROTECTION+BUREAU&o=&y=2016'
read_html(url1) %>% html_nodes(xpath="//*[@id=\"example\"]") %>%
html_table()
я получаю только (одинокий) заголовок:
[[1]]
[1] Name Grade Pay Plan Salary Bonus Agency Location
[8] Occupation FY
<0 rows> (or 0-length row.names)
Моего желаемый результат представляет собой кадр данных или data.table со всеми 1537 записями.
Edit: Вот соответствующая информация от Хрома инспектировать, заголовок в thead
и данных в tbody
tr
Я считаю, что это связано с тем, что эта конкретная страница использует вызовы AJAX для заполнения таблицы *** после *** загрузки страницы. Я исследую решение этой проблемы. – pbahr
Я попытался загрузить веб-страницу и сломать это. Тело таблицы пустое. Основные методы не будут работать. – Dave2e
Их данные поступают от OPM, который размещает свои данные на [data.gov] (http://catalog.data.gov/organization/opm-gov) в гораздо более удобных форматах. – alistaire