2013-04-09 4 views
2

У меня есть массив байтов, который содержит данные загруженного файла, который является резюме сотрудника (файл .doc). Я сделал это с помощью следующих строк кодаПреобразование содержимого массива байтов в строку

AppSettingsReader rd = new AppSettingsReader(); 

    FileUpload arr = (FileUpload)upresume; 
    Byte[] arrByte = null; 
    if (arr.HasFile && arr.PostedFile != null) 
    { 
     //To create a PostedFile 
     HttpPostedFile File = upresume.PostedFile; 
     //Create byte Array with file len 
     arrByte = new Byte[File.ContentLength]; 
     //force the control to load data in array 
     File.InputStream.Read(arrByte, 0, File.ContentLength); 
    } 

Теперь я хотел бы получить содержимое загруженного файла (резюме) в формате строка либо из массива байт или любых других способов. PS: «Содержимое» буквально относится к содержимому резюме; например, если в резюме (загруженном файле) содержится слово «программирование», я хотел бы иметь то же слово, что и в строке. Пожалуйста, помогите мне решить эту проблему.

+1

Я нашел это: [байт [] в строку в C#] (http://stackoverflow.com/questions/1003275/byte-to-string-in-c-sharp) – Lukasz

+0

поиск сетчатой ​​меня [ это] (http://stackoverflow.com/questions/11654562/how-convert-byte-array-to-string). – Brian

+0

Вы ищете одну строку, которая содержит весь текстовый контент (но ни один из других двоичных данных, связанных с файлом), или массив строк для каждого «слова» в файле? –

ответ

0

Я работал над аналогичным проектом несколько лет назад. Короче говоря ... Я закончил восстановление файла и сохранил его на сервере, затем программно преобразовал его в pdf, а затем проиндексировал содержимое pdf, в то время это оказалось намного проще на практике.

В качестве альтернативы, если вы можете ограничить отправку резюме в формате файла docx, вы можете использовать библиотеку Microsoft OpenXML для простого анализа и индексации содержимого. Но в практике это может привести к проблемам удобства использования для пользователей веб-сайта.

Смежные вопросы