Вот код HTML от http://chem.sis.nlm.nih.gov/chemidplus/rn/75-07-0 в Google Chrome, который я хочу проанализировать на сайте для какого-либо проекта.Как настроить запрос XPath для разбора HTML?
<div id="names">
<h2>Names and Synonyms</h2>
<div class="ds"><button class="toggle1Col"title="Toggle display between 1 column of wider results and multiple columns.">↔</button>
<h3 id="yui_3_18_1_3_1434394159641_407">Name of Substance</h3>
<ul>
<li id="ds2">
`` <div>Acetaldehyde</div>
</li>
</ul>
</div>
Я написал питон скрипт, который поможет мне сделать такую вещь, захватывая имя под одной из секций, но она просто не возвращает имя. Я думаю, что это мой запрос xpath, предложения?
from lxml import html
import requests
import csv
names1 = []
page = requests.get('http://chem.sis.nlm.nih.gov/chemidplus/rn/75-07-0')
tree = html.fromstring(page.text)
//This will grab the name data
names = tree.xpath('//*[@id="yui_3_18_1_3_1434380225687_700"]')
//Print the name data
print 'Names: ', names
//Convert the data into a string
names1.append(names)
//Print the bit length
print len(names1)
//Write it to csv
b = open('testchem.csv', 'wb')
a = csv.writer(b)
a.writerows(names1)
b.close()
print "The end"
Я ничего не знаю о Pyton, но может быть вам нужно добавить '/ текст()' - // * [@ ид = "yui_3_18_1_3_1434394159641_407"]/текст() – splash58
Да я пробовал, но не получилось Работа. – TimTom
Я открыл вашу ссылку, там нет такого элемента. – splash58