2013-07-31 4 views
1

Я пытаюсь захватить количество слов из загруженного слова doc (.doc, .docx, .rtf), но он всегда переносит раздражающее форматирование Word.PHP - получить количество слов из загруженного документа Microsoft Word

Кто-нибудь раньше занимался этой проблемой и знал, как ее решить? Спасибо :)

+0

Возможный дубликат: http://stackoverflow.com/questions/7330660/count-number-of-words-from-doc-txt-docx-files – Schlaus

ответ

4

Вам нужно будет:

  1. Отличить тип файла

    $file_name = $_FILES['image']['name']; 
    $file_extn = end(explode(".", strtolower($_FILES['image']['name']))); 
    
    if($file_extn == "doc" || $file_extn == "docx"){ 
        docx2text(); 
    }elseif($file_extn == "rtf"){ 
        rtf2text(); 
    } 
    
  2. Преобразование документа в текст

    https://stackoverflow.com/a/7371315/2512934 для док или DOCX http://webcheatsheet.com/php/reading_the_clean_text_from_rtf.php для RTF

  3. сосчитать слова http://php.net/manual/en/function.str-word-count.php

+0

Спасибо за ваш Ответ :) Это отлично работает для .docx, но, к сожалению, не для .rtf. Не думайте, что вы тоже могли бы мне помочь? :) –

+0

Я отредактировал ответ. Если я отвечу на ваш вопрос, пожалуйста, отметьте мой как ответ на вопрос. –

Смежные вопросы