Я не эксперт на языках или не знаю об этом. Я извлекаю данные с веб-сайта, который является наполовину динамичным.Должен ли я использовать Xpath или regexp для этого?
Например, мне нужно иметь 2 столбца для «Консультирование по плану покупки жилья - Тип клиента» и «Консультирование по плану покупки жилья - Тип инвестиций», в котором будут перечислены типы клиентов и инвестиции (может быть несколько), они могут войти в одну ячейку, но имеют какой-то разделитель, такой как «;».
Вот что появляется таблица, как
Вот что появится такой код:
Консультирование по плану покупки жилья
<div id="a2Nb000000035ohEAA" class="collapse DisciplineDetails PassportDetails PermDesc">
<h3 class="PermissionsListHeader">Advising on a home purchase plan</h3>
<br>
<br>
</div>
<ul class="PermissionConditionsList">
<li class="PermissionsConditionsItem">
Customer Type
<ul class="PermCondsLimitationsList">
<li style="list-style: none"><span id="j_id0:j_id1:j_id110:regActTable:0:j_id531:0:j_id533:0:j_id535:0:j_id538"></span></li>
<li class="PermCondsLimitationsItem Popover">Customer</li>
</ul>
</li>
</ul>
<ul class="PermissionConditionsList">
<li class="PermissionsConditionsItem">
Investment Type
<ul class="PermCondsLimitationsList">
<li style="list-style: none"><span id="j_id0:j_id1:j_id110:regActTable:0:j_id531:1:j_id533:0:j_id535:0:j_id538"></span></li>
<li class="PermCondsLimitationsItem Popover">Home purchase plans</li>
</ul>
</li>
</ul>
</div>
P.S. im используя Import.io для этой экстракции. – Tomas
, прежде чем приступать к использованию RegExp, пожалуйста, поздоровайтесь с [tony the pony] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) ... используйте xpath или просто [querySelector] (https://developer.mozilla.org/en-US/docs/Web/API/Document/querySelector) и [querySelectorAll] (https: //developer.mozilla. org/en-US/docs/Web/API/Document/querySelectorAll) –
Благодарим вас за помощь Jaromanda X, есть ли вероятность, что вы могли бы закодировать такой xpath для этой задачи? Я задираю, чтобы найти какую-то простую информацию об этом, так как это слишком сложно для меня .. – Tomas