2012-04-14 1 views
-1

Я разрабатываю приложение с использованием PHP, которое извлекает все предложения с другой веб-страницы, используя CURL. хотя я могу извлечь все данные, я нахожу трудности с извлечением полностью сформированного предложения. Я упомянул все связанные вопросы и помог мне точно так, как хотел. Пожалуйста, советыизвлечь первое полностью сформированное предложение из html дампа веб-страницы

HTML содержание, откуда я должен извлечь полностью сформированный приговорить

<p><font size="1" color="#C0C0C0">© Copyright <br></font><a href="http://www.dddddd.com" target="_blank"><font size="1" color="#C0C0C0">apple orange Ltd</font></a><font size="1"color="#C0C0C0"><a href="http://sm2.dddd.com/stats.asp?site=sm2ph0t0" target="_top"><img src="http://sm2.dddd.com/meter.asp?site=sm2ph0t0" alt="Site Meter" border=0></a></font></p></td><td valign="top" width="24"></td><!--msnavigation--><td valign="top"><p align="center"><a href="http://www.orangeapple.com" target="_blank"><img border="0" src="asddaf.jpg" alt="Sponsored by Ace Murder Mystery" width="85" height="121"></a><font face="Times New Roman"><b><b><u>Posters</u></b><br><font size="3" color="#008080">To find a large selection of jay joes prints and posters including framing options, please type the word..<font color="#996633"> asdasd </font></a><font color="#996633">&nbsp;</font> in the box below:<br><b> 

В принципе, если вы заметили, есть много irrelavant предложений, которые могли бы выйти. я хотел бы извлечь предложение из выше, которое имеет минимум «6» слов в строке . Я должен получить «Найти большой выбор jay joes prints и плакатов» в качестве вывода.

Спасибо, Jay

+1

Как будут предложения разделяться? – PeeHaa

+0

hmmmm .. желательно, если разработчики страниц позаботились об этом, он должен быть полностью остановлен, но если это не так, я бы не пропустил длинную конкатенированную строку, поскольку я бы только извлекал первые 50 слов. надеемся, что ответит на ваш вопрос – Jay66online

+0

полную остановку с предложением: «© Copyrightapple orange LtdPostersTo найти большой выбор отпечатков и плакатов jay joes, включая варианты кадрирования, пожалуйста, введите слово». – PeeHaa

ответ

0

Я получил это решить, используя следующие

$paras = $doc->getElementsByTagName('p'); 

    for ($l = 0; $l < $paras->length; $l++) 
    { 
     $para = $paras->item($l); 
     $paraContent = $para->textContent; 
     $urlDet['para'] .= trim_text($paraContent, 1000); 
    } 

Благодаря тому, кто попытался ответить ...

Смежные вопросы