2015-03-22 3 views
0

Я вставляю текст в открытый XML-документ. Текст, который я извлекаю и вставляю в документ, содержит форматирование HTML, т. Е. < p> некоторый текст </p> < p> Больше текста </p> таким образом, вставленный текст внутри слова получает это как текст. Может ли текст с HTML получить бросок на что-то открытое XML-документы поймут?Удалить html-теги из строки и сохранить текст openxml?

ответ

1

Новый ответ:

Существует на самом деле проект на CodePlex, что делает именно то, что вы ищете.

Смотрите здесь проект здесь:
Html to OpenXml on codeplex

Однако; если форматирование (заголовки/абзацы и т. д.) не важно, вы можете просто полностью отделить HTML-теги.

Вот учебник о том, как сделать это:
C# Remove HTML Tags


Старый ответ (OP сформулированное свой вопрос немного странным, и я понял):

Что вы нужно сделать, так или иначе закодировать свой HTML-код; вы можете использовать base64 или что-то, что плавает на вашей лодке. «Простой» HTML-кодирование, вероятно, будет лучшим способом действий здесь.

Таким образом, HTML не разрушит ваш XML.

У ASP.NET есть поддержка для этого; но вы можете сделать это в любом приложении, импортировав требуемое пространство имен.

Вот пример. HtmlEncode from Class Library

+0

Hi. Я получаю этот результат <p> some textt. </p > <p> Это было не очень удобно для XML :). Я использовал этот класс: string TestString = "Это ."; string EncodedString = System.Web.HttpUtility.HtmlEncode (TestString); – Ilyas

+0

Да. Это можно безопасно хранить в вашем XML, а затем декодировать, когда вам это нужно. :) –

+0

Мне нужно сразу его декодировать :), я разработал кнопку, и при нажатии кнопки открывается открытый документ XML (ms word). Я создаю документ, используя поток памяти и записываю текст на лету. Строки, которые я пишу в сгенерированный документ, имеют форматирование html. Я попытался удалить форматирование с помощью класса HthmlEncode, как было предложено, и попытался удалить html. Если я убираю html, теги удаляются, а затем я теряю пространство между абзацами. Если я использую HthmlEncode, я получаю специальные символы в документе. Все, что я хочу, это иметь некоторый формат, который может открыть открытый XML (Word). – Ilyas