2015-09-10 1 views
0

am пытается извлечь этот текст Factory/Production Operatives из этого html с помощью jsoup любезно скажите мне, что я делаю неправильно.как выбрать этот тег в html в jsoup и извлечь текст

</td> 
         <td><a id="MasterPage1_MainContent__ctlResultsFlatTrovix_rptResults__ctl3_lnkTitle" title="" href="http://demourl.uk/GetJob.ashx?JobID=19279943&amp;JobTitle=Factory%20%2f%20Production%20Operatives&amp;rad=20&amp;rad_units=miles&amp;pp=25&amp;sort=rv.dt.di&amp;vw=b&amp;re=134&amp;setype=2&amp;tjt=factory&amp;where=oldham&amp;pg=1&amp;AVSDM=2015-09-09T09%3a41%3a00-05%3a00">Factory/Production Operatives</a></td> 
         <td><span id="MasterPage1_MainContent__ctlResultsFlatTrovix_rptResults__ctl3_lblCompany">TipTopJob</span></td> 
         <td> 
        <span id="MasterPage1_MainContent__ctlResultsFlatTrovix_rptResults__ctl3_lblArea">NW-ashton/under/lyne</span> 
        <span id="MasterPage1_MainContent__ctlResultsFlatTrovix_rptResults__ctl3_lblCity"></span> 
       </td> 
        </tr> 

здесь является jsoup часть кода я работаю над

titlee[i] = hrefElements.get(i).attr("href,td");<br> 
titlee[i] = hrefElements.get(i).getElementsByAttribute("href").after("a.title").attr("title"); 
+0

PLease потраченные впустую часы просто помогите человеку cmon –

+0

Вам нужно получить форму значения 'a' not' href' –

+0

a.title? или getElementsByAttribute ("a"). after ("a.title"). attr ("title"); –

ответ

0

Вы должны выбрать якоря, а затем вы можете выбрать его текст или атрибуты

Document doc = Jsoup.parse(html); 
    Elements a = doc.select("a"); 
    for(Element e : a) { 
     String linkHref = e.attr("href"); 
     String linkText = e.text(); 
     System.out.println(linkHref + linkText); 
    } 

linkTExt является текстом метки привязки.

+0

RP wow потрясающий очень хорошо, спасибо, сэр! solute you, одна вещь, я есть, извлечение другого нежелательного html, я только хочу извлечь данные из этой строки, так как я разместил html выше, возможно, максимум 20 строк из них данные 1 после другого я только что разместил 1 часть чтобы упростить работу с вами, код, который вы предоставили, очень мило, он просто захватывает другие нежелательные ссылки и тексты, которые не нужны. –

+0

Селекторы Jsoup являются мощными, если вы хотите ограничить их по шаблону, вы можете это сделать. См. Это http://jsoup.org/cookbook/extracting-data/selector-syntax –

+0

Я добавил 'Elements a = doc.select (" tr a [title] ");' и теперь он делает то, что я хочу, я действительно хочу поблагодарить ** RP - ** за то, что помог мне, и я не знаю, что сказать, что я действительно даю вам большое большое спасибо и обнять ** rp ** Спасибо. –

Смежные вопросы