Я использую import.io программное обеспечение для извлечения данных из Edmunds ... Пример страницы http://www.edmunds.com/bugatti/veyron-164/2009/st-101194582/features-specs/Какой XPATH мне нужно извлечь конкретные данные с сайта Edmunds?
Я по электронной почте [email protected] несколько раз, но они помогли мне только один раз и сказал, что не хватает времени и ресурсов помогать с вопросами об отдельных проектах, а не о самом их программном обеспечении.
я успешно извлекаемые технические данные с использованием XPATH, например // тд [содержит (., «Лошадиная сила»)]/SPAN
<td>
<label>HORSEPOWER</label>
<span> 1001 hp @ 6000 rpm</span>
</td>
Но я не знаю, как извлечь функции, которые находятся между < литий > и не охватываются другим кодом с определенной меткой, но имеют определенное число < h3/h4> несколько строк выше. XPATH // li извлекает все функции в одном столбце, а также другие данные, которые мне не нужны.
Скажите, пожалуйста, XPATH, который извлекает функции по отдельным категориям, комфорту, развлечениям, функциям безопасности и т. Д. Мне нужно поместить функции в один столбец для каждой категории функций.
<h3 id="safety_feat" class="safety-feat">Safety Features</h3>
<div class="hr thick"></div>
<table class="items only-values" data-selenium="safety">
<tr>
<td>
<ul class="items">
<li><p>4-wheel ABS</p></li>
</ul>
</td>
Еще одна вещь, которая добавила бы бонус в мою базу данных, чтобы извлечь названия цветов и значения RGB, было бы возможно?
<span style="display: block; background-color:rgb(255,255,255);">
<span style="display: block;" class="clrtxt">COLOR NAME</span>
Это очень сложный XPATH, и он работает, спасибо! – Future