У меня есть веб-сайт, который будет читать, в частности, файл стиля XML с PHP и отображать некоторый контент. Люди, обновляющие веб-сайт, не так утехно настроены, и поэтому я надеялся создать программу, покрывающую Powerpoint, в тип XML, который я ищу.C# с HTML-тегами
Я конвертирую PowerPoint -> RTF -> HTML. Выходной образец ниже:
<p style="text-align:center;"><span style="background-color:#FFFFFF;font-family:Calibri font-size:44pt;">Title 1</span></p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">Data in here.</span></p>
<p> </p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">More Data.</span></p>
<p> </p>
Я хочу, чтобы прочитать это Html строка за строкой, интерпретации тегов и создавать свой собственный файл из данных.
I.e: Каждый тег с определенным тегом будет классифицирован как заголовок, тогда все с другим конкретным тегом будет классифицироваться как данные.
Пример Ouptut:
<FILE>
<ITEM>
<TITLE>Title 1</TITLE>
<DATA><p>Data in here</p><p> </p><p>More Data.</p></DATA>
</ITEM>
</FILE>
(Как) это может быть сделано?
Примечание: Я не ищу, как удалить все теги: Like here и and here
Примечание 2: Powerpoint не имеет фиксированного шрифта/размера шрифта. Если возможно, я бы хотел, чтобы он был полностью независимым от sytle. Если это не сработает, можно ли сделать это с помощью фиксированного шаблона в PowerPoint, чтобы каждый раздел заголовка и данных был бы таким же, имея те же теги?
Вы можете использовать 'HtmlAgilityPack' для анализа HTML. –