2016-03-23 2 views
8

Есть ли возможность достичь направления текстового текста снизу вверх в xmlworker? Я хотел бы использовать его в таблице. Мой кодИспользование itextsharp xmlworker для преобразования html в pdf и записи текста по вертикали

 <table border=1> 
    <tr> 
    <td style="padding-right:18px"> 
      <p style="writing-mode:sideways-lr;text-align:center">First</p</td> 
    <td style="padding-right:18px"> 
      <p style="writing-mode:sideways-lr;text-align:center">Second</p></td></tr> 
    <tr><td><p style="text-align:center">1</p> </td> 
     <td><p style="text-align:center">2</p></td> 
    </tr> 
     </table> 

Но это не работает после преобразования из HTML в PDF. Текст FIRST и SECOND не находятся в направлении вверх-вниз.

+0

Вам нужно написать специальный код, чтобы сделать это. Если вы добавите '' '' '' '' '' '' '' '' '' '' '' того, что вы ожидаете, кто-то _might_ сможет помочь ... – kuujinbo

ответ

6

Это была довольно интересная проблема, поэтому +1 к вопросу.

Первым шагом было найти, поддерживает ли iTextSharp XML Worker HTMLtd тег. Отображения можно найти в источнике в iTextSharp.tool.xml.html.Tags. Там вы обнаружите, что td сопоставлен с iTextSharp.tool.xml.html.table.TableData, что упрощает работу по созданию пользовательского процессора тегов. То есть все, что нам нужно сделать наследовать от класса и переопределить End():

public class TableDataProcessor : TableData 
{ 
    /* 
    * a **very** simple implementation of the CSS writing-mode property: 
    * https://developer.mozilla.org/en-US/docs/Web/CSS/writing-mode 
    */ 
    bool HasWritingMode(IDictionary<string, string> attributeMap) 
    { 
     bool hasStyle = attributeMap.ContainsKey("style"); 
     return hasStyle 
       && attributeMap["style"].Split(new char[] { ';' }) 
       .Where(x => x.StartsWith("writing-mode:")) 
       .Count() > 0 
      ? true : false; 
    } 

    public override IList<IElement> End(
     IWorkerContext ctx, 
     Tag tag, 
     IList<IElement> currentContent) 
    { 
     var cells = base.End(ctx, tag, currentContent); 
     var attributeMap = tag.Attributes; 
     if (HasWritingMode(attributeMap)) 
     { 
      var pdfPCell = (PdfPCell) cells[0]; 
      // **always** 'sideways-lr' 
      pdfPCell.Rotation = 90; 
     } 
     return cells; 
    } 
} 

Как отмечалось в инлайн комментарии, это очень простая реализация для ваших конкретных потребностей. Вам нужно будет добавить дополнительную логику для поддержки любых других writing-modeCSS property value и включить любые проверки работоспособности.

UPDATE

Основываясь на комментарии, оставленные @Daniel, это не ясно, как добавлять пользовательские CSS при преобразовании HTML в PDF. Первый обновленный HTML:

string XHTML = @" 
<h1>Table with Vertical Text</h1> 
<table><tr> 
<td style='writing-mode:sideways-lr;text-align:center;width:40px;'>First</td> 
<td style='writing-mode:sideways-lr;text-align:center;width:40px;'>Second</td></tr> 
<tr><td style='text-align:center'>1</td> 
<td style='text-align:center'>2</td></tr></table> 

<h1>Table <u>without</u> Vertical Text</h1> 
<table width='50%'> 
<tr><td class='light-yellow'>0</td></tr> 
<tr><td>1</td></tr> 
<tr><td class='light-yellow'>2</td></tr> 
<tr><td>3</td></tr> 
</table>"; 

Затем небольшой фрагмент пользовательского CSS:

string CSS = @" 
    body {font-size: 12px;} 
    table {border-collapse:collapse; margin:8px;} 
    .light-yellow {background-color:#ffff99;} 
    td {border:1px solid #ccc;padding:4px;} 
"; 

Немного трудная часть является дополнительной настройкой - вы не можете использовать простой из коробки XMLWorkerHelper.GetInstance().ParseXHtml() часто видели здесь, в SO. Вот простой вспомогательный метод, который должен вам начать:

public void ConvertHtmlToPdf(string xHtml, string css) 
{ 
    using (var stream = new FileStream(OUTPUT_FILE, FileMode.Create)) 
    { 
     using (var document = new Document()) 
     { 
      var writer = PdfWriter.GetInstance(document, stream); 
      document.Open(); 

      // instantiate custom tag processor and add to `HtmlPipelineContext`. 
      var tagProcessorFactory = Tags.GetHtmlTagProcessorFactory(); 
      tagProcessorFactory.AddProcessor(
       new TableDataProcessor(), 
       new string[] { HTML.Tag.TD } 
      ); 
      var htmlPipelineContext = new HtmlPipelineContext(null); 
      htmlPipelineContext.SetTagFactory(tagProcessorFactory); 

      var pdfWriterPipeline = new PdfWriterPipeline(document, writer); 
      var htmlPipeline = new HtmlPipeline(htmlPipelineContext, pdfWriterPipeline); 

      // get an ICssResolver and add the custom CSS 
      var cssResolver = XMLWorkerHelper.GetInstance().GetDefaultCssResolver(true); 
      cssResolver.AddCss(css, "utf-8", true); 
      var cssResolverPipeline = new CssResolverPipeline(
       cssResolver, htmlPipeline 
      ); 

      var worker = new XMLWorker(cssResolverPipeline, true); 
      var parser = new XMLParser(worker); 
      using (var stringReader = new StringReader(xHtml)) 
      { 
       parser.Parse(stringReader); 
      } 
     } 
    } 
} 

Вместо того, чтобы повторять объяснение примере кода выше, see the documentation (IText удален документацию, связанную с Wayback Machine), чтобы получить лучшее представление о том, почему вам нужно настройте парсер таким образом.

Также обратите внимание:

  1. XML работник не поддерживает все свойства CSS2/CSS3, поэтому может потребность экспериментировать с тем, что работает или не работает в отношении того, как близко вы хотите PDF, чтобы посмотреть на HTML, отображаемый в браузере.
  2. Фрагмент HTML удалил тег p, так как стиль можно применить непосредственно к тегу td.
  3. Inline width Недвижимость. Если они опущены, столбцы будут переменной ширины, которые совпадают, если текст будет отображаться горизонтально.

Протестировано с версиями iTextSharp и XML Worker 5.5.9 Вот обновленный результат:

enter image description here

+0

Большое спасибо. Это очень полезно. В моем случае html-файл большой. Существует много таблиц, но только две таблицы нуждаются в вертикальном тексте. Интересно, как реализовать в своем кодовом остатке собственный CSS. Я сделал это раньше: 'using (var myCss = new MemoryStream (System.Text.Encoding.UTF8.GetBytes (example_css))) { using (var msHtml = new MemoryStream (System.Text.Encoding.UTF8.GetBytes (example_html)))) {iTextSharp.tool.xml.XMLWorkerHelper.GetInstance(). ParseXHtml (writer, doc, msHtml, myCss); } } ' – Daniel

+0

@ Daniel - обновил ответ, включив вспомогательный метод, который позволяет вам передать строку' HTML' и строку 'CSS'. – kuujinbo

+0

Еще раз спасибо большое. – Daniel

0
public void addHtmlToPdf(Document document, PdfWriter writer, String html) { 
    PdfPTable table = new PdfPTable(1); 
    PdfPCell cell = new PdfPCell(); 
    ElementList list = XMLWorkerHelper.ParseToElementList(html, null); 
    foreach(IElement element in list) { 
     cell.AddElement(element); 
    } 
    table.AddCell(cell); 
    document.Add(table); 
} 

Альтернатива с utf8:

public void addHtmlToPdf_Utf8(Document document, PdfWriter writer, String html) 
{ 
    XMLWorkerHelper xml = XMLWorkerHelper.GetInstance(); 
    xml.ParseXHtml(writer, document, stringToStream(html), System.Text.Encoding.UTF8); 
} 
public Stream stringToStream(string txt) { 
    var stream = new MemoryStream(); 
    var w = new StreamWriter(stream); 
    w.Write(txt); 
    w.Flush(); 
    stream.Position = 0; 
    return stream; 
} 
Смежные вопросы