2015-04-25 2 views
1

Я пытаюсь создать парсер, который может загружать данные с веб-страницы. Проблема в том, что страница, вероятно, «динамически генерируется». В фигурных скобках есть некоторый код, который, вероятно, генерирует HTML-код. Это похоже на код Django.Динамически сгенерированная веб-страница скребок

Вот картина:

<script charset="utf-8" type="text/javascript">var browseDefaultColumn = 4; var browse5ColumnLength= '15,24'; var browse4ColumnLength = '20,28'; var browse3ColumnLength = '25,42';var priceFilterSliderEnabled = true;var browseLowPageLength = 24;var browseHighPageLength = 100;</script> 
<script id="products-template" type="text/template"> 
    {{#products}} 
     <li class="{{RowCssClass}}" style="{{RowStyle}}" li-productid="{{ItemCode}}"> 
      <div class="s-productthumbbox"> 
       <div class="productimage s-productthumbimage col-xs-6 col-sm-12 col-md-12"> 
        <a href="{{PrdUrl}}" class="s-product-sache">{{#ImgSashVisible}} 
          <img src="{{ImgSashUrl}}" class="rtSashImg img-responsive"> 
         {{/ImgSashVisible}} 
        </a> 
        <a href="{{PrdUrl}}" class="ProductImageList"> 
         <div> 
          <img class="rtimg img-responsive" src='{{MainImage}}' alt='{{Brand}} {{DisplayName}}' /> 
         </div> 
         {{#EnableAltImages}} 
          <div class="AlternateImageContainerDiv"> 
           <img class="rtimg ProductImageListAlternateImage img-responsive" src='{{AltImage}}' alt='{{Brand}} {{DisplayName}}' /> 
          </div> 
         {{/EnableAltImages}} 
        </a> 
        <div class="QuickBuyAndWishListContainerDiv hidden-xs {{QuickBuyAndWishListCss}}"> 
         {{#IsQuickBuyEnabled}} 

Я ищу способ, как получить весь код, содержащий сгенерированный код, так что я могу разобрать его, например, с помощью Beautiful Soup. Или другой эффективный способ получить данные.

ответ

0

HTML, который у вас есть, вероятно, является шаблоном, и его необходимо проанализировать с помощью механизма шаблонов для заполнения содержимого, после чего вы сможете получить окончательный HTML-код и проанализировать его.
Обычно вы не получаете шаблон HTML-сервера с сервера, это должен быть автономный файл?

Смежные вопросы