Я новичок в Python и пытаюсь работать с Pattern. Моя цель - получить код, который даст мне синоним входного слова, посмотрев его из IndoWordnet. Язык должен быть бенгальским. У меня уже есть список слов. Но я не уверен, как именно, с помощью шаблона я могу веб-поиск ввода. Я пробовал следовать за http://arunrocks.com/easy-practical-web-scraping-in-python/. Это не помогло. Я хотел начать с проанализированной веб-страницы, и это то, что я сделал. Это плохо дает нам абсолютную связь.Как получить данные шахтер для конкретного поиска на веб-странице?
from lxml.html import fromstring
from urllib2 import urlopen
def get_page(url) :
html = urlopen(url).read()
dom = fromstring(html)
dom.make_links_absolute(url)
return dom
dom = get_page('http://www.cfilt.iitb.ac.in/indowordnet/first?langno=3&queryword=%E0%A6%97%E0%A6%BE%E0%A6%A7%E0%A6%BE')
<Element html at 0x50b4840>
Но я застрял после этого, так как не знаю, как выполнить определенный поиск с рисунком. Пожалуйста помоги.
@ user3458145 ок, извините, неправильно поняли немного, так как я не знаю, как хинди и бенгали. Проверьте раздел «UPD» - должны дать вам все синонимы. – alecxe
@ user3458145 Я использовал инструменты разработчика Chrome -> вкладку в сети, чтобы узнать, какие вызовы AJAX идут. Речь идет не о python - большинство вещей связаны с xpath и web-scraping. – alecxe
Как получить «% s» часть «http://www.cfilt.iitb.ac.in/indowordnet/ajax/onto.jsp?sid=%s»? – user3458145