2013-05-28 4 views
1

Каков наилучший способ извлечения данных из таблицы из URL-адреса?Получить tabledata из html, JSOUP

Короче мне нужно получить фактические данные из этих 2-х столов: http://www.oddsportal.com/sure-bets/

В этом примере данные будут «Paddy Power» и «3,50» Смотреть это изображение:

(Извините за размещение изображения, подобного этому, но мне все еще нужна репутация, я отредактирую позже) http://img837.imageshack.us/img837/3219/odds2.png

Я пытался с Jsoup, но я не знаю, если это лучший способ? И я, кажется, не правильно перемещаться вниз таблиц, я пытался что-то вроде этого:

tables = doc.getElementsByAttributeValueStarting("class", "center"); 
    link = doc.select("div#col-content > title").first(); 
    String text1 = doc.select("div.odd").text(); 

Таблицы вещь кажется, чтобы получить какие-то данные, но не включает в себя текст в таблице

ответ

1

Извините, чувак. Второе поле, которое вы хотите получить, заполнено JavaScript. Jsoup не выполняет JavaScript. Чтобы выбрать заголовок первой строки вы можете использовать:

Document doc = Jsoup.connect("http://www.oddsportal.com/sure-bets/").get(); 
    Elements tables = doc.select("table.table-main").select("tr:eq(2)").select("td:eq(2)"); 
    System.out.println(tables.select("a").attr("title")); 

Цепные выбирает используемые для визуализации.

+0

О, это позор .. Есть ли способ получить данные, заполненные JavaScript каким-то образом? – Yoshidk

+0

К сожалению, не с Jsoup, но, пожалуйста, см. Мой ответ здесь: http://stackoverflow.com/questions/13666453/trying-to-parse-html-hidden-by-javascript/14715242#14715242 Я перечислил некоторые библиотеки, которые могут помочь тебе. – ollo

+0

Im все еще довольно новичок в программировании :( Какая из этих других библиотек будет обрабатывать мою проблему лучше всего/проще? Я не могу найти какие-либо хорошие примеры с любым из этих – Yoshidk

Смежные вопросы