Мне поручили создать доступный канал RSS для списков вакансий моей компании. У меня уже есть RSS-канал от нашего партнера по подбору персонала; поэтому я преобразовываю их RSS XML в наш собственный прокси-канал RSS, чтобы добавить дополнительные данные, а также ограничить количество элементов в фиде, чтобы мы перечислили последние задания.Strip WordML из строки
RSS проверяет через feedvalidator.org (с предупреждениями); но проблема в этом. К сожалению, независимо от того, сколько раз я им говорю; персональная команда моей компании напрямую копирует и вставляет свои документы Word в наших партнеров по рекрутингу CMS при вставке новых списков вакансий, оставляя WordML в моем канале. Я считаю, что этот WordML вызывает проблемы с функцией Feedburner BrowserFriendly; которые мы хотим показать, чтобы облегчить людям подписку. Поэтому мне нужно удалить разметку WordML в фиде.
У кого-нибудь есть опыт? Может ли кто-нибудь указать мне на хорошее решение этой проблемы?
Предпочтительно; Я хотел бы указать на решение в .Net (VB или C# в порядке) и/или XSL.
Любые советы по этому поводу приветствуются.
Спасибо.
Статья Джеффа посвящена очистке отвратительного HTML, который генерирует Word, а не удалению элементов XML из файла WordML. – 2009-11-05 17:02:42