Проблема: веб-сайт, на котором я пытаюсь собрать данные, использует Javascript для создания графика. Я хотел бы получить данные, которые используются на графике, но я не уверен, с чего начать. Например, данные могут быть следующими:Как я могу анализировать переменные Javascript с помощью python?
var line1=
[["Wed, 12 Jun 2013 01:00:00 +0000",22.4916114807,"2 sold"],
["Fri, 14 Jun 2013 01:00:00 +0000",27.4950008392,"2 sold"],
["Sun, 16 Jun 2013 01:00:00 +0000",19.5499992371,"1 sold"],
["Tue, 18 Jun 2013 01:00:00 +0000",17.25,"1 sold"],
["Sun, 23 Jun 2013 01:00:00 +0000",15.5420341492,"2 sold"],
["Thu, 27 Jun 2013 01:00:00 +0000",8.79045295715,"3 sold"],
["Fri, 28 Jun 2013 01:00:00 +0000",10,"1 sold"]];
Это данные о ценах (дата, цена, объем). Я нашел здесь еще один вопрос: Parsing variable data out of a js tag using python - что говорит о том, что я использую JSON и BeautifulSoup, но я не уверен, как применить его к этой конкретной проблеме, потому что форматирование немного отличается. На самом деле, в этой проблеме код больше похож на python, чем на любой тип формата словаря JSON.
Я полагаю, что я мог бы прочитать его как строку, а затем использовать XPATH и некоторые фанки редактирования строки, чтобы преобразовать его, но это кажется слишком большой работой для того, что уже отформатировано как переменная Javascript.
Итак, что я могу сделать здесь, чтобы вытащить этот тип организованных данных из этой переменной при использовании python? (Я знаком с питоном и BS4)
, кроме разрыва строки после '=' и 'var' ключевое слово, остальное действительно в питона –
Это фактический код? или это переменная, называемая 'line1', которая является списком списков? Если это последний, вы можете 'для списка в строке1: do_something_with (list [0], list [1], list2])' – IPDGino
Это переменная с именем line1, которая является частью содержимого страницы при загрузке и представляет собой список списков. –