2015-07-17 4 views
1

Что я пытаюсь сделать здесь, это те значения после «=>» Можно ли сделать с BeautifulSoup?Как получить данные массива с помощью BeautifulSoup из исходного кода?

Это то, что в исходном коде:

<!-- <pre style="text-align: left">Array 
(
[vl_lance_order] => R$ 34.000 
[data_leilao] => 17-07-2015 - 10h00 
[nm_identificacao] => 
[incremento_minimo] => 2000 
[incremento_sistema] => 2000.00 
[mensagem] => FOTOS ATUALIZADAS 
[segmento_id] => 667740 
[dt_inicioleilaoonline] => 2015-07-13 
[nm_img] => C667740A.JPG;C667740B.JPG;C667740C.JPG;C667740D.JPG;C667740E.JPG;C667740F.JPG 
[nu_contadorvisita] => 921 
[vl_multiplo] => 0.00 
[ordenacao] => 0 
[nm_deposito] => Curitiba 
[numlances] => 14 
[cli] => 1230 
[nm_cliente] => BANCO MERCEDES-BENZ S.A 
[link] => /leilao/12240/lote/1485951/segmento/veiculos/ordenacao/data_leilao/tipo-ordenacao/crescente/qtde-itens/15/visualizacao/visual_imagem/item-atual/1/pagina/1/ 
) 
</pre> --> 

Да, это комментируется.

То, что я до сих пор:

url = 'https://www.example.com' 
source_code = requests.get(url) 
soup = BeautifulSoup(source_code.content, "html5lib") 

Другие решения, кроме использования BeautifulSoup приветствуются. tks

ответ

1

Если исходный код всегда будет иметь такую ​​же форму, как и вы, почему бы вам не подумать, просто разделите его на строки и разделите его на "=>"?

for line in src.split("\n"): 
    segs = line.split("=>") 
    if len(segs) == 2: 
     key = segs[0].strip().replace("[", "").replace("]", "") 
     value = segs[1].strip() 
0

Почему бы вам не сделать это?

  • Итерации по всем линиям.
  • Найдите строки, содержащие => символ.
  • Затем разделите на символ =>, а затем распечатайте индекс 1 разбитого списка.
Смежные вопросы