разбор результата ImportXml с XPATH в Документах Google распространять лист

У меня есть следующие функции в клетке моего Google дока таблицы:разбор результата ImportXml с XPATH в Документах Google распространять лист

=IMPORTXML(J15, "//meta[@name='description']/@content")

мне нужно, чтобы захватить значения из следующей строки из this facebook страницы : https://www.facebook.com/pages/Christine-Simpson/135960496435727

<meta name="description" content="Christine Simpson. 68 likes · 3 talking about this. Christine Laura Simpson 
    is a Canadian television personality, best known as a hockey reporter, 
    host...">

Эта функция отлично работает и имеет следующий вывод в моем Google Docs клетки:

"Christine Simpson. 68 likes · 3 talking about this. Christine Laura Simpson 
is a Canadian television personality, best known as a hockey reporter, 
host..."

Но мне нужно зафиксировать только «количество понравившихся» из этой строки и число «говорить об этом» в мою ячейку и избавиться от всего остального текста.

Я попробовал следующий способ использования функции tokenize() XPATH в возвращаемой строке.

=IMPORTXML(J2, "tokenize('//meta[@name='description']/@content', '.')")

Однако я получаю сообщение об ошибке: «Импортные XML не может быть разобраны»

Любая помощь будет оценена.

Thx

источник

2015-07-24 am1234

'подстрока-после (подстрока-раньше (// мета [@ имя =«описание»]/@ содержание,«говорить об этом "),". ")' возвращает '68 нравится · 3' Вы можете использовать функцию перевода для удаления буквы :) – splash58

Это поможет, если вы указали фактический URL-адрес, чтобы мы могли протестировать. Также учтите, что большое количество функций xpath НЕ реализовано в листах google importXML. Вам лучше работать с importXML, как описано в верхней части сообщения, а затем обрабатывать строку с помощью стандартных функций листа, таких как SPLIT() или INDEX() или MID() – user3616725

@ user3616725 спасибо за комментарий, я добавил URL-адрес – am1234

Это потому, что IMPORTXML ожидает в выражение Xpath (что-то вроде //meta[@name='description']/@content) в качестве второго аргумента.

Вы можете использовать регулярные выражения для извлечения данных, которые Вам нужны

=REGEXEXTRACT(A1,"[0-9]+\s+likes") =REGEXEXTRACT(A1,"[0-9]+\s+talking\s+about\s+this")

источник

2015-08-01 21:31:44 user2314737

разбор результата ImportXml с XPATH в Документах Google распространять лист

ответ

Смежные вопросы