У меня есть трубка Yahoo, принимающая канал Atom из группы Google, и я хочу сделать некоторую обработку в полном тексте сообщения (запуск различных регулярных выражений для извлечения данных). Я могу получить текст с сообщением, в виде обычного текста с от Google, используя URL, как это:Извлечение простого текста в Yahoo Pipes
http://groups.google.com/group/(group_name)/msg/(message_id)?dmode=source&output=gplain
Однако, у меня проблемы при получении его в Yahoo Pipes как строковое значение. Извлечь страницу из страниц, отличных от HTML. YQL с помощью таблицы HTML, кажется, работает, и заворачивает простой текст внутри элемента AP, текст которой можно извлечь так:
select * from html where url="..." and xpath="//p"
Однако, если текст сообщения содержит HTML-тег, YQL возвращает HTML поддерево вместо строка. Есть ли способ сгладить его обратно в свой HTML-источник?
Вы можете разместить ссылку на трубе? – Victor