2015-12-10 3 views
0

Мне было интересно, можно ли перепроектировать XPath WebElement, если известен один из атрибутов, но путь неизвестен. Например, предположим, что XPath для определенного WebElement (@ id, 'vi_main_img_fs_thImg')]/img, но это неизвестно. Однако я знаю, что этот WebElement возвращает http://myimage.com/72hjf89 (т. Е. Уникальное значение) при вызове WebElement.getAttribute («src») - можно ли использовать эту информацию для «обратной инженерии» исходного значения XPath? Возможно, с помощью Regex или что-то еще?Reverse Engineer XPath of WebElement

Примечание. Элемент .getAttribute («src») был всего лишь примером, я полагаю, что любой метод работает независимо от того, какой атрибут используется, пока это значение возникает один раз на странице.

Любые идеи?

Update:

Чтобы дать более подробный пример того, что я пытаюсь достичь Я копирую HTML код ниже.

страница Я смотрю на это: http://www.ebay.com/itm/111488868372

HTML, на странице:

<document> 
<html lang="en" xmlns:og="http://opengraphprotocol.org/schema/" xmlns:fb="http://www.facebook.com/2008/fbml" webdriver="true"> 
<head> 
<body class=" vi-contv2 lhdr-ie- vi-hd-ops " style="background-image: url("data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAAKCAYAAAB10jRKAAAAGXRFWHRTb2Z0d2FyZQBBZG9iZSBJbWFnZVJlYWR5ccllPAAAADBJREFUeNpEyqERADAIBMGbbwSH+qhA/6URXMyqBUhFBLIP6ip0ezk2zExqC58nwACVZwX67tO41gAAAABJRU5ErkJggg=="), url("http://ir.ebaystatic.com/pictures/aw/pics/cmp/ds3/imgbg.jpg"); background-repeat: repeat-x, repeat; background-position: 0px 30px, 0px 0px;"> 
<div id="gh-gb" tabindex="-1"/> 
<!-- Default filmstrip js used with main image --> 
<!-- adding filmstrip js used in main pic and with images carousel --> 
<div id="Head"/> 
<div id="Body" class=" sz940 " itemtype="http://schema.org/Product" itemscope="itemscope"> 
<div id="TopPanelDF"> 
<div id="CenterPanelDF"> 
<div id="CenterPanel" class=" ebaylocale_en_US ebay_longlngsite "> 
<style> /* PicturePanel */ #PicturePanel div.img { border:1px solid #ccc; background-color:white; } /* BuyBox */ .actPanel { border-top:1px solid #ccc; border-left:1px solid #ccc; border-right:1px solid #ccc; } .watchListCmp { border-bottom:1px solid #ccc; border-left:1px solid #ccc; border-right:1px solid #ccc; } </style> 
<h3 class="vi-inheritstyl"> 
<div id="vi_sme_prmts_bnr_cntr1" class="vi-sme-ss-v1"> 
<!-- Placement 100005 --> 
<!-- Placement 100011 && 100012 --> 
<div id="CenterPanelInternal" class=""> 
<div id="PicturePanel" class="pp-c"> 
<h3 class="g-hdn">Picture Information</h3> 
<div class="pp-ic pp-ic300"> 
<div class="l-shad lftd img img300"> 
<table class="img img300"> 
<tbody> 
<tr> 
<td class="img img300"> 
<div id="test"> 
<script type="text/javascript">var sPT = new Date().getTime(),picTimer,picTimer1,picTimer2;</script> 
<a id="linkMainImg" style="display: block; cursor: default; text-decoration: none;" href="javascript:;"> 
<div id="mainImgHldr" class="" title="Journeys-Edge-Deluxe-Manicure-Set-with-Deluxe-Carrying-Case" style="width: 300px; background-image: none; cursor: pointer;"> 
<!-- <span id="mainImgHldr" style="display: inline-block;"> --> 
<img id="icThrImg" class="img img300 vi-hide-mImgThr" alt="Image is loading" imgsel="0" src="http://ir.ebaystatic.com/pictures/aw/pics/globalAssets/imgLoading_30x30.gif" style="display:none;"/> 
<img id="icImg" class="img img300" alt="Journeys-Edge-Deluxe-Manicure-Set-with-Deluxe-Carrying-Case" clk="0" onload="picTimer=new Date().getTime();" style="" src="http://i.ebayimg.com/images/g/eHAAAOSwLzdWS4C8/s-l300.jpg" itemprop="image" mskuskip="false"/> 
<!-- </span> --> 
</div> 
</a> 

Значение "ЦСИ" является: http://i.ebayimg.com/images/g/eHAAAOSwLzdWS4C8/s-l300.jpg (это единственное известное значение)

Значение (ID), которое я пытаюсь получить с помощью этого метода, составляет:

.//*[@id='PicturePanel']/div[1]/div[1]/table/tbody/tr/td/ a/div/img [2] (это i s элемент XPath)

+0

Я не понял вас. –

ответ

0

Вы можете просто использовать другой XPATH.

Идентификатор будет (как правило) уникальным, поэтому имеет смысл искать элемент, используя атрибут id.

UPDATE: Вы можете получить идентификатор с помощью XPATH, который выглядит следующим образом:

//img[@src = "http://i.ebayimg.com/images/g/eHAAAOSwLzdWS4C8/s-l300.jpg"]/string(@id) 

В случае, когда результат имеет более одного элемента, вы получите последовательность.

+0

Извините, но я попробовал это, и он говорит, что XPath недействителен. Предполагается, что это двойные кавычки вокруг http-части? Где я могу узнать больше об этом синтаксисе? –

+0

Проверьте это для начала: http://www.w3schools.com/xsl/xpath_syntax.asp Можете ли вы привести пример из HTML, который вы пытаетесь проанализировать, чтобы я мог дать более точный ответ? –

+0

Я обновил вопрос .. –

Смежные вопросы