а) определить самую последнюю версию Pandoc и захватить URL с помощью пакета XML
:
library(XML)
page <- readLines('http://code.google.com/p/pandoc/downloads/list', warn = FALSE)
pagetree <- htmlTreeParse(page, error=function(...){}, useInternalNodes = TRUE, encoding='UTF-8')
url <- xpathSApply(pagetree, '//tr[2]//td[1]//a ', xmlAttrs)[1]
url <- paste('http', url, sep = ':')
б) Или применить некоторые магические регулярных выражений благодаря @ G.Grothendieck вместо (нет необходимости для XML
пакета таким образом):
page <- readLines('http://code.google.com/p/pandoc/downloads/list', warn = FALSE)
pat <- "//pandoc.googlecode.com/files/pandoc-[0-9.]+-setup.exe"
line <- grep(pat, page, value = TRUE); m <- regexpr(pat, line)
url <- paste('http', regmatches(line, m), sep = ':')
с) Или просто проверить самую последнюю версию вручную, если вы чувствуете как то:
url <- 'http://pandoc.googlecode.com/files/pandoc-1.10.1-setup.exe'
Great! Любой способ автоматически распознать последнюю версию? –
@TalGalili: Конечно, я добавил многообещающий рабочий способ распознать последнюю версию. – daroczig
Ах, и жаль частых изменений, я больше не буду трогать этот пост. Я обещаю :) – daroczig