2016-02-20 1 views
1

Я хочу извлечь данные из таблицы html.import.io: получить входное значение, которое находится вне <tr>

Твердая вещь, что один из необходимых данных столбца является до фактического ряда, здесь вы можете увидеть на скриншоте:

enter image description here

У вас есть какие-либо идеи, как получить значение скрытого вход в фактическую строку таблицы?

+0

Технически эта структура HTML недействительна, поэтому, когда браузер делает это, она перемещается в своей внутренней DOM. Попробуйте извлечь данные в виде дочерних элементов (любой глубины) таблицы или родительского элемента таблицы. Например. В jQuery: 'var input = $ ('table: input');' – scunliffe

+1

Конечно, я должен был упомянуть ... Если у вас есть возможность исправить исходный код HTML, чтобы сделать его действительным, сделайте это вместо/сначала. – scunliffe

+0

Я нахожусь на нем, тем не менее, приветствуются любые предложения по исправлению этого недопустимого кода. Bash/Linux предпочтительнее, потому что я загружаю страницы из CLI. – Adrian

ответ

0

Мне удалось получить некоторые значения, используя XPaths.

Постройте каждую строку, как обычно, с помощью курсора мыши. Он будет захватить заголовок, а так в ряд обучающего набора перейдите к 2.

Затем можно дать следующее XPaths

идентификаторами:(.//preceding::input[contains(@name, "id")]/@value)[last()]

Имя:(.//td[@class="cart-data"])[3]

цена:(.//td[@class="cart-data"])[6]

enter image description here

Смежные вопросы