Примечание: Я новичок в python, javascript и соскабливании.Как разобрать этот тип текста?
Я соскабливаю веб-сайт на питоне, используя красивый суп и механизирую. Некоторые данные загружаются через запросы ajax. У меня возникли проблемы со сбоем ответа.
Пример запроса Ajax URL: http://example.com/getJSData/?file=/data/js/GetData.js&cmd=GETDATA&rc=BGAN
Образец ответа: d1 = [[ "m11", "m12", "m13"], [ "m21", "m22", "m23" ]]; d2 = [["x11", "x12"], ["x21", "x22"], ["x31", "x32"]]
Хотя весь ответ не является надлежащим json-объектом , значения каждого из d1 и d2 являются допустимым объектом JSON, что я могу анализировать с использованием некоторого json-парсера в python. Но как разобрать весь ответ?
Очевидным способом является поиск всего «=» в ответе и извлечение объекта json, а затем его анализ с помощью json parser.
Но я считаю, что должен быть более элегантный способ сделать это (анализ всего ответа). Не могли бы вы посоветовать?
Заранее благодарен!
Один быстрого примечания, я считаю, вы имеете в виду 'scraping', не' scrapping' – Dendromaniac
Как ответ возвращаемый? Какой тип объекта? Строка? –
Ответ в действительном синтаксисе Python ... Интересно, будет ли вообще полезно использовать ast.parse. – Kevin