Уничтоженный IMG SRC вывода в base64

Я пытаюсь скрести только https:// ссылка:Уничтоженный IMG SRC вывода в base64

src ="https://static.daraz.com.bd/p/apple-1088-5942-1-catalog.jpg"

из приведенного ниже кода с использованием библиотеки BeautifulSoup4 Python.

<div class="image-wrapper default-state"> 
     <img class="lazy image -loaded" alt="Macbook Air (MD711ZA/B) - Aluminum - Laptop - Dual-Core Intel Core i5 - 4GB RAM - 128GB HDD - 11.6&amp;#039;&amp;#039; LED - Intel HD Graphics 5000 - Mac OS X Mountain Lion 10.8" data-image-vertical="1" width="176" height="220" src="https://static.daraz.com.bd/p/apple-1088-5942-1-catalog.jpg" data-sku="AP113ELAA1XBNAFAMZ" data-placeholder="placeholder_daraz.jpg" style="display: inline-block;"> 
     <noscript>&lt;img src="https://static.daraz.com.bd/p/apple-1088-5942-1-catalog.jpg" width="176" height="220" class="image" /&gt; 
     </noscript> 
</div>

Но я получаю выход, как это:

data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7

Любой способ получить оригинальный src link?

код BeautifulSoup:

for image in soup.findAll('div', attrs={'class': 'image-wrapper default-state'}): 
      print image.img['src']

Тот же самый код работает на других сайтах и получить ссылку Src. Но только здесь он выводится в формат base64.

источник

2015-10-11 Sadman

Опубликовать код, который вы используете. Вы очищаете данные src вместо текста src. –

@EugeneK Добавил код в сообщение. Пожалуйста, еще раз проверьте. :) – Sadman

Кажется, работает для меня с вашим предоставленным образцом. –

преобразовал всю img тега в string, а потом я узнал, что tag они использовали была <data-img src=" ">

Итак, я просто использовал это tag и получила ожидаемый результат.

for image in soup.findAll('div', attrs={'class': 'image-wrapper'}): 
    print image.img['data-src']

источник

2015-10-15 14:57:48 Sadman

Уничтоженный IMG SRC вывода в base64

ответ

Смежные вопросы