2016-12-26 3 views
0

Я пишу простой код для очистки данных с веб-страницы с помощью функции selenium и xpath2.0.Функции Xpath 2.0, не работающие в Java, с использованием Saxon

Поскольку Селен поддерживает только функции xpath1.0, я пытаюсь использовать Saxon.jar

  1. Я скачал и извлечены файлы Saxon9he.jar в путь «C: \ Program Files \ Java \ jre1 .8.0_111 \ Lib \ вн»
  2. Я создал файл "jaxp.properties" со следующими строками: javax.xml.transform.TransformerFactory = net.sf.saxon.TransformerFactoryImpl javax.xml.xpath. XPathFactory "," net.sf.saxon.xpath.XPathFactoryImpl
  3. Также включены мои файлы jar в библиотеке eclipse.

Но, я не могу получить значения с помощью функций Xpath2.0.

В моем коде, если я использую

XPathFactory factory = XPathFactory.newInstance(); 

вместо

XPathFactory factory = XPathFactory.newInstance(NamespaceConstant.OBJECT_MODEL_SAXON); 

Я могу использовать функции xpath1.0. Но мне нужна функция Xpath2.0. пожалуйста, помогите мне в этом.

Мой код:

import java.io.IOException; 
import java.io.StringReader; 

import javax.xml.parsers.DocumentBuilder; 
import javax.xml.parsers.DocumentBuilderFactory; 
import javax.xml.parsers.ParserConfigurationException; 
import javax.xml.xpath.XPath; 
import javax.xml.xpath.XPathConstants; 
import javax.xml.xpath.XPathExpression; 
import javax.xml.xpath.XPathExpressionException; 
import javax.xml.xpath.XPathFactory; 
import javax.xml.xpath.XPathFactoryConfigurationException; 
import javax.xml.xpath.XPathFunctionResolver; 
import javax.xml.xpath.XPathVariableResolver; 

import org.openqa.selenium.WebDriver; 
import org.openqa.selenium.firefox.FirefoxDriver; 
import org.w3c.dom.Document; 
import org.w3c.dom.NodeList; 
import org.xml.sax.InputSource; 
import org.xml.sax.SAXException; 

import net.sf.saxon.lib.NamespaceConstant; 
import net.sf.saxon.xpath.XPathFactoryImpl; 


public class XpathCheckClass { 

public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException, XPathFactoryConfigurationException, XPathExpressionException{ 


WebDriver dr = new FirefoxDriver(); 

dr.get("http://s15.a2zinc.net/clients/hartenergy/midstream17/Public/eBooth.aspx?Nav=False&BoothID=137384"); 
try { 

Thread.sleep(3000); 

} catch (Exception e) { 

} 

String source = dr.getPageSource(); 

Document doc = null; 

try { 

DocumentBuilder db = DocumentBuilderFactory.newInstance().newDocumentBuilder(); 

doc = db.parse(new InputSource(new StringReader(source))); 

} catch (Exception e) { 
e.printStackTrace(); 
} 

System.setProperty("javax.xml.xpath.XPathFactory:"+NamespaceConstant.OBJECT_MODEL_SAXON, "net.sf.saxon.xpath.XPathFactoryImpl"); 
XPathFactory factory = XPathFactory.newInstance(NamespaceConstant.OBJECT_MODEL_SAXON); 

// XPathFactory factory = XPathFactory.newInstance(); ---> default xpath factory 

XPath xpath = factory.newXPath(); 
XPathExpression expr = xpath.compile("if(//h2) then //h2 else //h1"); 

NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET); 

System.out.println(nodes.getLength()); 

for (int i = 0; i < nodes.getLength(); i++) { 
System.out.println(nodes.item(i).getTextContent()); 
} 


dr.close(); 
} 

} 

ответ

1

Последние выпуски Saxon больше не рекламируют себя как услуги XPath JAXP, так что вам нужно создать экземпляр XPath завод в явном виде:

XPathFactory xf = new net.sf.saxon.XPathFactoryImpl(); 
+0

Просто добавить небольшое пояснение : причина, по которой Saxon JAR не проявляет себя как процессор XPath, заключается в том, что слишком много приложений собирали его случайно, когда они были написаны и протестированы для работы с XPath 1.0. К сожалению, интерфейс JAXP не дает никакого способа сказать «пожалуйста, найдите мне процессор XPath 2.0». –