URL1: https://duapp3.drexel.edu/webtms_du/
Установить сеанс, чтобы очистить страницу
URL2: https://duapp3.drexel.edu/webtms_du/Colleges.asp?Term=201125&univ=DREX
URL3: https://duapp3.drexel.edu/webtms_du/Courses.asp?SubjCode=CS&CollCode=E&univ=DREX
В качестве личного проекта программирования, я хочу, чтобы очистить свой каталог курсов университета и предоставить его в качестве RESTful API ,
Однако я столкнулся с следующей проблемой.
Страница, которую мне нужно очистить, - URL3. Но URL3 возвращает только содержательную информацию после посещения URL2 (он устанавливает термин Colleges.asp?Term=201125
), но URL2 можно посещать только после посещения URL1.
Я пытался контролировать данные HTTP, идущие туда и сюда, используя Fiddler, и я не думаю, что они используют файлы cookie. Закрытие браузера мгновенно сбрасывает все, поэтому я подозреваю, что они используют Session.
Как я могу очистить URL 3? Я пробовал, программно, сначала посещать URL-адреса 1 и 2, а затем делать file_get_contents(url3)
, но это не работает (возможно, потому, что он регистрируется как три разных сеанса.
Существует сеанс быть установлен с помощью куки: 'ASPSESSIONIDASBRRCCS' является его имя, хотя я не могу понять, почему URL2 надо (может быть, я забыл обратить внимание первый раз) – Grexis
@Grexis : Ах, спасибо за информацию. URL3 предоставляет информацию, например, о том, где будет проходить класс, и кто его возьмет. Это зависит от термина (семестр), который, похоже, устанавливается в URL2 – xbonez
Возможно, стоит упомянуть, что php является одним из немногих динамических языков, на котором нет библиотеки механизации. По этой причине perl python или ruby - лучший выбор для очистки. – pguardiario