2015-06-06 3 views
0

Я использую BeautifulSoup для получения HTML-страницы веб-страницы. Пока это прекрасно. Но то, что я действительно хочу, это содержимое этого блока javascript внутри HTML, который заключен в <script type="text/javascript">, а затем внутри этого тега, в конце концов есть гигантский массив, в котором много скобок {}, и я считаю, что это массив JSON ?Скребок javascript/json объекта с веб-страницы с помощью BeautifulSoup?

Есть ли способ, которым я могу попытаться извлечь весь массив из HTML?

+1

* Если * не находится в строке и разбирается с JSON.parse, это объект Object Literal. JSON просто очень тесно связан с таким синтаксисом JavaScript (с ограничениями и незначительными отличиями). – user2864740

+0

В Javascript '{}' (фигурные скобки) указывают [объект] (https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Object) и '[]' (скобки) указывают [array] (https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Array) –

+1

'import json', затем' foo = json.loads (objectText) ': [18,2. json - кодировщик и декодер JSON] (https://docs.python.org/2/library/json.html) – har07

ответ

0

Вы ищете функцию json.loads.

>>> import json 
>>> obj = json.loads('{"a": 12, "b": null}') 
>>> obj 
{'b': None, 'a': 12} 
+0

Это сработало! Спасибо. – DoubleBass

Смежные вопросы