2013-11-08 2 views
0

У меня есть этот код:Как получить выпущенную дату с веб-страницы?

url = "http://www.padtube.com/Audio-Music-Editor/10-75359.html" 
pageurl = urllib.urlopen(url) 
soup = BeautifulSoup(pageurl) 

for table in soup.select("table#product-quickfacts-table"): 
    print table.find('meta',{'itemprop':'datePublished'}) 

Когда я запускаю этот код, он дает мне этот выход:

<meta content="2012-03-01T00:00:00-05:00" itemprop="datePublished"/> 

Как я могу взять только дату?

ответ

1

ваша линия

print table.find('meta',{'itemprop':'datePublished'}) 

<meta content="2012-03-01T00:00:00-05:00" itemprop="datePublished"/> 

возвращает элемент мета, содержащий атрибут itemprop='datePublished'. Вы просто хотите получить доступ к узлу content этого элемента xml

print table.find('meta',{'itemprop':'datePublished'})['content'] 

2012-03-01T00:00:00-05:00 
+0

Может ли это быть полоса так, чтобы она могла принимать только 2012-03-01? –

+0

Я уже получил это. Спасибо! –

+0

't.split ('T') [0]' если t ваша строка будет работать – Bruce

Смежные вопросы