Следующий код работает для отдельных файлов .html:R: Синтаксическая группу HTML файлов с петлей
doc <- htmlParse("New folder/1-4.html")
plain.text <- xpathSApply(doc, "//td", xmlValue)
plain.text <- gsub("\n", "", plain.text)
gregexpr("firstThing", plain.text)
firstThing <- substring(plain.text[9], 41, 50)
gregexpr(secondThing, plain.text)
secondThing <- substring(plain.text[7], 1, 550)
Но следующий цикл не делает и дает мне ошибку:
содержание XML не кажется быть XML
file.names <- dir(path = "New folder")
for(i in 1:length(file.names)){
doc <- htmlParse(file.names[i])
plain.text <- xpathSApply(doc, "//td", xmlValue)
gsub("\n", "", plain.text)
firstThing[i] <- substring(plain.text[9], 41, 50)
secondThing[i] <- substring(plain.text[7], 1, 550)
}
Я просто пытаюсь извлечь информацию (как я был в состоянии сделать в первой партии кода), а также создать вектор информации.
Любые идеи о том, как решить эту проблему?
Да, спасибо за указание на это, но он все еще не решает проблему с ошибкой. – user2880936