2014-09-12 3 views
-1

Я хочу найти все аудиофайлы, такие как .mp3, .wav, .ogg, .wma и т. Д. На сайте. Используя Python. Это мой код >>Поиск всех аудио-ссылок на странице с использованием python

url = urllib.request.urlopen(link) 
    content = url.read() 
    soup = BeautifulSoup(content) 
    links = [a['href'] for a in soup.find_all('a',href=re.compile('http.*\.mp3'))] 
    print (str(len(links)) + " Audios Found ") 
    # print (links) 
    print("\n".join(links)) 

Найдет только .mp3 ссылки. Я хочу другие аудио-ссылки.

ответ

1

Поскольку вы используете регулярное выражение для выбора ссылок, измените эту строку

links = [a['href'] for a in soup.find_all('a',href=re.compile('http.*\.mp3'))] 

в

links = [a['href'] for a in soup.find_all('a',href=re.compile('http.*\.(mp3|wav|ogg|wma)'))] 
+0

Спасибо человеко @kums .. Другие способы также будет полезно .. :) –

Смежные вопросы