Я использую BeautifulSoup для получения HTML-страницы веб-страницы. Пока это прекрасно. Но то, что я действительно хочу, это содержимое этого блока javascript внутри HTML, который заключен в <script type="text/javascript">
, а затем внутри этого тега, в конце концов есть гигантский массив, в котором много скобок {}
, и я считаю, что это массив JSON ?Скребок javascript/json объекта с веб-страницы с помощью BeautifulSoup?
Есть ли способ, которым я могу попытаться извлечь весь массив из HTML?
* Если * не находится в строке и разбирается с JSON.parse, это объект Object Literal. JSON просто очень тесно связан с таким синтаксисом JavaScript (с ограничениями и незначительными отличиями). – user2864740
В Javascript '{}' (фигурные скобки) указывают [объект] (https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Object) и '[]' (скобки) указывают [array] (https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Array) –
'import json', затем' foo = json.loads (objectText) ': [18,2. json - кодировщик и декодер JSON] (https://docs.python.org/2/library/json.html) – har07