Пытается разобрать/очистить сайт курса для memphis. Сайт «https://spectrumssb2.memphis.edu/pls/PROD/bwckgens.p_proc_term_date». Кажется, это какая-то проблема с javascript или динамическая генерация текста. Я могу видеть, лежащий в основе структуры DOM с помощью livehttpdheaders/Firefox, но не тогда, когда я просто просмотреть основной источник/текст страницы ..web scraping/parsing of course course of course
Мысли/Комментарии/указатели будут оценены ...
Ох. Забыл упомянуть. В конечном итоге я буду использовать python/urllib/mechanize, чтобы проанализировать сайт, как только я выясню, как получить доступ к основному тексту/данным. Спасибо! –
Невозможно просмотреть это без входа. – phoebus