Я использую это:Почему saveXML создает ` ` linebreaks?
foreach ($paragraph->childNodes as $child) {
$value .= $paragraph->ownerDocument->saveHTML($child);
}
Проблема заключается в том, что в моей $value
меня
там, где в исходном документе у меня есть разрыв строки.
Вот одна часть исходного HTML:
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
<meta name=Generator content="Microsoft Word 12 (filtered)">
<title>SomeTitle</title>
</head>
<body lang=EN-US link=blue vlink=purple>
<div class=WordSection1>
<p class=3abstract><b>Abstract:</b> Five new anthranilic acid derivatives.</p>
</body>
</html>
ли вы сталкивались с этим раньше?
Несомненно, я отредактирую свой андер немедленно –
Я вижу, что генератор «Microsoft Word 12». M $ печатает новые строки как '\ r \ n'. Попробуйте нормализовать их с помощью 'preg_replace ('~ \ R ~ u'," \ n ", $ html)', затем загрузите html –