Я выскабливание некоторые данные из Google Translate так:Возникли проблемы разделения строки
import urllib
import mechanize
get_url=("https://translate.google.ie/translate_a/single?client=t&sl=auto&tl=es&hl=en&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&dt=at&ie=UTF-8&oe=UTF-8&source=btn&ssel=0&tsel=3&kc=0&tk=520887|911740&q=Hellow%20World")
browser=mechanize.Browser()
browser.set_handle_robots(False)
browser.addheaders=[('User-agent','Chrome')]
translate_text=urllib.urlopen(get_url).read()
print translate_text
Который дает мне следующий вывод:
[["Hellow Mundial", "Hellow World"]]
undefined
"en"
undefined
undefined
[["Hellow", 1,…], ["World", 2,…]]
0.022165652
undefined
[["en"], undefined, [0.022165652]]
Что можно увидеть здесь:
Поэтому я пытаюсь разделить данные на]], поэтому мой вывод будет только:
[["Hellow Mundial", "Hellow World"]]
Я разделив данные следующим образом:
translate_text=translate_text.split("]]")
print translate_text[0]
Однако, когда я запускаю это я получаю разметку страницы. Перед расколом я получил результат запроса. Как получилось, что раскол вызывает это и не разбивает строку так, как предполагалось?
Я загляну в библиотеку JSON, приветствую. Я пытаюсь следовать этому руководству, и он, похоже, не использовал его: https://www.youtube.com/watch?v=Igvf5C7qwO0. Конкретный вопрос - 11:50. –
Ой - если он действительно раскалывает его вручную, это невероятно неправильно. Весь смысл JSON заключается в том, чтобы сделать очень легко отправлять массивы и словари между машинами. –
Это недействительно json возвращается –