Я хотел бы прочитать несколько таблиц в R от http://www.nhl.com/stats/player?navid=nav-sts-indiv#, а в одной таблице отображается только 30 строк, если их насчитывается> 300. Используя XML и readHTMLTables, как я могу извлечь и объединить все таблицы в один большой фреймворк, который я могу выполнить.Прочитайте несколько таблиц через скребок
Я использовал цикл для чтения страниц 1-11, но есть много разных таблиц, которые меня интересуют, и не думаю, что эффективно смотреть на каждого, чтобы увидеть, сколько всего таблиц/строк есть.
require(XML)
url='http://www.nhl.com/stats/player?fetchKey=20153ALLSASAll&viewName=summary&sort=points&gp=1&pg='
a=NULL
for(i in 1:11){
w=paste(url,i,sep='')
b=readHTMLTable(w)[[3]]
a=rbind(a,b)
}
Обратите внимание, что есть 11 URL-адресов, о которых я знаю, потому что я посмотрел его вручную.
Есть ли способ, по которому каждый может подумать, где я могу автоматически вычислить общее количество строк/таблиц, чтобы я не искал его вручную. Может быть, есть функция, которую я не встречал?
это здорово! Он работал даже с несколькими новыми наборами таблиц данных. Я буду искать xpathApply, page_divs, xmlGetAttr и stringr. благодаря! – alex