Скремблирование информации о плейлисте с сайта

Я пытаюсь очистить имена артистов и песен от онлайн-игрового журнала ежедневного радиошоу, которое мне нравится. Я бы хотел в конечном итоге использовать эти очищенные данные, чтобы использовать python для компиляции списка воспроизведения на Spotify или Youtube.Скремблирование информации о плейлисте с сайта

Почему мой код не извлекает и не печатает все песни?

import urllib2 
from bs4 import BeautifulSoup # latest version bs4 

soup = BeautifulSoup(urllib2.urlopen("http://music.cbc.ca/#!/The-Signal").read(), 'lxml') 

song = soup.find_all("span", {'class': 'logTrackTitle'}) 

print song

My code

источник

2016-03-06 Zack

Скопируйте код в свой вопрос –

Спасибо, сделано. Обратная связь оценена. – Zack

Snooping вокруг страницы с помощью Chrome DevTools, вы увидите, что секция транслируемого Журнала 'страниц на самом деле IFrame с другой URL. Вот где список песен «исходит».

Сворачивание URL-адреса iframe в ваш код правильно возвращает песни.

import urllib2 
from bs4 import BeautifulSoup # latest version bs4 

soup = BeautifulSoup(urllib2.urlopen("http://music.cbc.ca/The-Signal").read(), 'lxml') 

song = soup.find_all("span", {'class': 'logTrackTitle'}) 

print song

источник

2016-03-06 05:22:58

Большое спасибо. – Zack

Скремблирование информации о плейлисте с сайта

ответ

Смежные вопросы