2016-12-04 1 views
0

Я пытаюсь импортировать данные в электронную таблицу google с помощью importxml, но каждый раз, когда я пытаюсь, я получаю ту же ошибку: «Импортируемый XML-контент не может быть проанализирован». (Исходное сообщение - немецкий, я перевел.)Google Spreadsheet возвращает «XML-контент не может быть разобран»

Данные, которые я хочу импортировать, находятся в h1 страницы продукта amazon. В качестве примера я использую следующее: https://www.amazon.de/Harry-Potter-verwunschene-Special-Rehearsal/dp/3551559007/.

Вы понимаете, почему следующее не работает?

=importXml("https://www.amazon.de/Harry-Potter-verwunschene-Special-Rehearsal/dp/3551559007/"; "//h1/span[1]") 

Я ценю каждую руку помощи!

+0

Stackoverflow предназначен для программирования вопросов. Вопросы электронной почты Google более подходят для [WebApps] (http://webapps.stackexchange.com/questions/tagged/google-spreadsheets). – MikeJRamsey56

ответ

0

SO это сейчас загружается JavaScript, так что если вы берете, что последний номер в конце вашего URL 3551559007 и добавить его на этот URL строку https://www.amazon.de/gp/search-inside/service-data?method=getBookData&asin= вы увидите необработанный JSON, где данные - и вы можете разобрать его из есть:

https://www.amazon.de/gp/search-inside/service-data?method=getBookData&asin=3551559007

так что в этом случае вы можете в основном мы эту формулу, чтобы выйти название:

=REGEXREPLACE(CONCATENATE(IMPORTDATA(A1)),"(^.*title:"")(.*)(""type:""html.*)","$2") 

enter image description here

или вы можете найти пользовательскую функцию импорта json и установить все, что выше - выше будет быстрее.

Смежные вопросы