2013-06-28 5 views
0

У меня есть HTML-страницаЧтения HTML таблицы и ввода данных в базу данных MySQL

table.html 
<table border="1"> 
<tr> 
<td>row 1, cell 1</td> 
<td>row 1, cell 2</td> 
</tr> 
<tr> 
<td>row 2, cell 1</td> 
<td>row 2, cell 2</td> 
</tr> 
</table> 

Я хочу, чтобы иметь возможность lynx -dump этой страницы и вставить данные из HTML таблицы в базу данных MySQL (HTML-страница будет всегда имеют одни и те же заголовки, но данные будут меняться ежедневно.

Я хотел бы получить этот скрипт собирается, а затем добавить в хрон, поэтому я не придется вручную вводить данные, как я нахожусь в данный момент!

Знает ли кто-нибудь все равно, чтобы это сделать, поскольку я действительно застрял в момент.

Thanks

ответ

0

Я не знаю ни одного готового решения. Если вы не боитесь какого-либо кодирования Python, я думаю, что с BeautifulSoup было бы легко перемещаться по html (не такая простая задача сама по себе).

Вы бы что-то вроде:

from bs4 import BeautifulSoup 
import MySQLdb 
db=MySQLdb.connect(passwd="xxx",db="xxx") 
c=db.cursor() 

soup = BeautifulSoup(html_file) 

tr_list=soup.find_all("tr") 
for tr in tr_list: 
    cell1=tr.find_all("td")[0] 
    cell2=tr.find_all("td")[1] 
    #do your sql insert here 
    c.execute ("SQL query here") 
c.close()