Я хочу отменить данные обо всех фильмах cbfcindia.Скребок DATA из Javascript с использованием SCRAPY и PYTHON
1) В поле для поиска, если Title = "а" все фильмы начиная с "а" заполняются (в URL, уа = а & Тип = поиск) http://cbfcindia.gov.in/html/uniquepage.aspx?va=a&Type=search
2) Список фильмов заполняются в таблице, теперь это JAVASCRIPT ЗДЕСЬ, если я нажимаю на первый фильм, я ввожу его детали, и я хочу очистить все эти детали для всех фильмов. Но я не могу сделать это даже для одного фильма.
3) Мои наблюдения: в источнике есть ниже функции:
function __doPostBack(eventTarget, eventArgument) {
if (!theForm.onsubmit || (theForm.onsubmit() != false)) {
theForm.__EVENTTARGET.value = eventTarget;
theForm.__EVENTARGUMENT.value = eventArgument;
theForm.submit();
}
}
и нам нужно передать параметры, основанные на JS. Но я понятия не имею, как это можно сделать.
items.py
from scrapy.item import Item, Field
class CbfcItem(Item):
MovieName = Field()
MovieLanguage = Field()
Roffice = Field()
CertificateNo = Field()
CertificateDate = Field()
Length = Field()
NameofProducer = Field()
#pass
cbfcspider.py
from cbfc.items import CbfcItem
class MySpider(BaseSpider):
name = 'cbfc'
allowed_domains= ["http://cbfcindia.gov.in/"]
start_urls = ["http://cbfcindia.gov.in/html/uniquepage.aspx?va=a&Type=search"]
def parse(self, response):
hxs = HtmlXPathSelector(response)
titles = hxs.select("//tbody") #Check
print titles
items = []
for titles in titles:
print "in FOR loop"
item = CbfcItem()
item ["MovieName"] = hxs.path('//*[@id="lblMovieName"]/text()').extract()
item ["MovieLanguage"] = hxs.path('//*[@id="lblLanguage"]').extract()
item ["Roffice"] = hxs.path('//*[@id="lblRegion"]').extract()
item ["CertificateNo"] = hxs.path('//*[@id="lblCertNo"]').extract()
item ["CertificateDate"] = hxs.path('//*[@id="Label1"]').extract()
item ["Length"] = hxs.path('//*[@id="lblCertificateLength"]').extract()
item ["NameofProducer"] = hxs.path('//*[@id="lblProducer"]').extract()
items.append(item)
print "this is ITEMS"
return items
print "End of FOR"
где вы находите «AGNI PARIKSHAYA» – user3698581
просто посмотрите на консоль, используйте инструменты разработчика наведите курсор на каждый фильм –