2012-03-25 3 views
0

У меня есть peice из HTML я взял из источника моего Twitter график, показанный здесь:Python, BeautifulSoup - Синтаксический из чирикать

http://pastebin.com/deefvbYw

Это один Tweet Я буду использовать для примера. Я не могу для жизни меня заставить его сотрудничать. Я хочу, чтобы показать:

Дмитрий @TheFPShow «Я делаю это все время ... youtube.com/watch?v=DF9WP8...»

Если кто-то может предложить некоторые предложения, которые бы Великий.

+6

Вы действительно должны использовать [API Твиттера] (https://dev.twitter.com/) вместо разбора HTML. – phihag

+1

Где мой код? Что вы пробовали? – Mig

ответ

1
soup = BeautifulSoup(twit) 

name_tag = soup('strong', {'class': 'fullname js-action-profile-name show-popup-with-id'}) 
user = name_tag[0].contents[0] 

action_tag = soup('span', {'class': 'username js-action-profile-name'}) 
at_sign = action_tag[0].contents[0].contents[0] 
show_name = action_tag[0].contents[1].contents[0] 

twit_text = soup('p', {'class': 'js-tweet-text'}) 
message = twit_text[0].contents[0] 
url = twit_text[0].contents[1]['data-expanded-url'] 

print user, at_sign, show_name, message, url 

Выход:

Dmitri @ TheFPShow I do this all the time... http://www.youtube.com/watch?v=DF9WP87KNPk 
Смежные вопросы