мне нужно проанализировать данные с сайта: http://www.sarkari-naukri.in/jobs-by-qualification/b-tech/sub-centre-manager.htmlданных Разбор с использованием BeautifulSoup в питона
Большинство учебник для BeautifulSoup предназначены для синтаксического анализа ссылок, а не в углубленном разборе необходимых данных по ссылке.
Теперь я прошел через какой-то учебник BeautifulSoup модуль питона и написал этот скрипт для загрузки требуемой строки данных из
<div id="content_box">
<div id="content" class="hfeed">...
Script я использую:
from BeautifulSoup import BeautifulSoup
import urllib2
def main():
url = "http://www.sarkari-naukri.in/jobs-by-qualification/b-tech/sub-centre-manager.html"
data = urllib2.urlopen(url).read()
bs = BeautifulSoup(data)
postdata = bs.find('div', {'id': 'content_box'})
postdata= [s.getText().strip() for s in postdata.findAll('div', {'class':'scdetail'})]
fname = 'postdata.txt'
with open(fname, 'w') as outf:
outf.write('\n'.join(postdata))
if __name__=="__main__":
main()
Но этот сценарий Безразлично» т выполнить то, что я ожидаю. Я хочу, чтобы получить пост данные в файл, как мудр:
Название: Вакансия Для Sub Center Manager В Национальном институте электроники и информационных технологий - Чандигарх
Sub Center Manager
Национальный институт электроники и информационных технологий
Адрес: NIELIT, Chandigarh SCO: 114-116 Сектор 17B
Почтовый индекс: 160017
города Чандигарх и так далее ....
Пожалуйста, помогите или предложить.
Благодаря