Написала функцию для чтения текста из документа PDF. Используется язык scala, Selenium, PDFBox 2.0.1.Scala Ошибка PDFBox в коде
Ниже приведен код:
enter code here
import org.openqa.selenium.firefox.{FirefoxBinary, FirefoxDriver, FirefoxProfile}
import org.apache.pdfbox.pdfparser.PDFParser
import org.apache.pdfbox.text.PDFTextStripper
import java.io.BufferedInputStream
def pdfreaddata {
driver.get("https://www.....pdf")
driver.manage.timeouts.implicitlyWait(50, TimeUnit.SECONDS)
val url: URL = new URL(driver.getCurrentUrl)
println(url)
val fileToParse: BufferedInputStream = new BufferedInputStream(url.openStream())
val parser: PDFParser = new PDFParser(fileToParse)
parser.parse()
val output: String = new PDFTextStripper().getText(parser.getPDDocument)
println("pdf Value" + output)
parser.getPDDocument.close()
driver.manage.timeouts.implicitlyWait(100, TimeUnit.SECONDS)
}
Показаны ошибки для PDFParser в val parser: PDFParser = new PDFParser(fileToParse)
Сообщение об ошибке:
не удается разрешить конструктору
Попробовал код в Java тоже , получая такую же ошибку.
Правильный вызов - PDDocument doc = PDDocument.load (поток). Использование нового PDFParser() - устаревший метод. Однако я не знаю, является ли это причиной ваших проблем. –