2015-04-08 4 views
0

Как получить содержимое div с классом с помощью веб-соскабливания?Как получить содержимое div с классом с помощью BeautifulSoup?

Я не могу получить подробную информацию о одном div с именем класса.

import mechanize 
import re 
import logging 

from BeautifulSoup import BeautifulSoup 
    br = mechanize.Browser() 
    br.set_handle_equiv(False) 
    url = "https://www.abcd.com" 
    ua = 'Mozilla/5.0 (X11; Linux x86_64; rv:18.0) Gecko/20100101  Firefox/18.0 (compatible;)' 
    br.addheaders = [('User-Agent', ua), ('Accept', '*/*')] 
    br.set_debug_http(True) 
    logging.getLogger('mechanize').setLevel(logging.DEBUG) 
    html = br.open(url) 
    soup = BeautifulSoup(html) 
    for i in soup.findAll('div', 'className'): 
     print i 

ответ

3

Вы можете использовать как этот

soup.findAll('div', {'attribute-name': 'attribute-value'}) 

Например:

soup.findAll('div', {'class': 'class-name'}) 
1

------ верхний код -----

html = br.open(url) 
    soup = BeautifulSoup(html) 
    for i in soup.findAll('div', {"class":"NAME_OF_CLASS"}) 
     print i 

Этот должен помочь вам.

Смежные вопросы