2016-03-06 3 views
0

Я пытаюсь очистить имена артистов и песен от онлайн-игрового журнала ежедневного радиошоу, которое мне нравится. Я бы хотел в конечном итоге использовать эти очищенные данные, чтобы использовать python для компиляции списка воспроизведения на Spotify или Youtube.Скремблирование информации о плейлисте с сайта

Почему мой код не извлекает и не печатает все песни?

import urllib2 
from bs4 import BeautifulSoup # latest version bs4 

soup = BeautifulSoup(urllib2.urlopen("http://music.cbc.ca/#!/The-Signal").read(), 'lxml') 

song = soup.find_all("span", {'class': 'logTrackTitle'}) 

print song 

My code

+0

Скопируйте код в свой вопрос –

+0

Спасибо, сделано. Обратная связь оценена. – Zack

ответ

0

Snooping вокруг страницы с помощью Chrome DevTools, вы увидите, что секция транслируемого Журнала 'страниц на самом деле IFrame с другой URL. Вот где список песен «исходит».

Сворачивание URL-адреса iframe в ваш код правильно возвращает песни.

import urllib2 
from bs4 import BeautifulSoup # latest version bs4 

soup = BeautifulSoup(urllib2.urlopen("http://music.cbc.ca/The-Signal").read(), 'lxml') 

song = soup.find_all("span", {'class': 'logTrackTitle'}) 

print song 
+0

Большое спасибо. – Zack

Смежные вопросы