Я хочу скопировать информацию о продукте с этого сайта: http://megabuy.vn/Default.aspx.Как очистить тег под тегом javascript?
Мое решение - очистить сайт в соответствии с структурой сайта. Поэтому сначала я должен очистить все ссылки об общей категории, прежде чем идти глубже в подкатегорию, а затем на каждый конкретный продукт.
У меня проблемы выскабливание все ссылки общих категорий, таких как:
- Фантхиет би ван Фонг
- может хижина ам
- сделать да помет Nha BEP
и т.д ...
Я думаю, проблема в том, что эти ссылки находятся под тегом java script.
Вот мой код:
from bs4 import BeautifulSoup
import requests
import re
def web_scrape(url):
web_connect = requests.get(url)
text = web_connect.text
soup = BeautifulSoup(text,"html.parser")
return soup
homepage = web_scrape("http://megabuy.vn/Default.aspx")
listgianhang = homepage.findAll("a", class_=re.compile("ContentPlaceholder"))
len(listgianhang)
я получил результат: 0
Итак, вы просмотрели структуру страницы в браузере и определили, что ссылки вложены в , и вы хотите знать, как с этим бороться? –
clearlight