2014-02-18 3 views
0

Для анализа: Microsoft Word 97/2003 (.doc) & Microsoft Word 2007/2010 (.docx) с использованием C# и WPF без установки Word, мне нужно знать, может ли кто-либо дайте мне серьезную библиотеку, чтобы использовать ее для достижения этой цели.Универсальный анализатор документов Microsoft Word без установки Word

Технически я итерация ZipEntry элементов, используя имеющуюся так:

foreach (string file in _listPathFiles) 
     { 
      using (Ionic.Zip.ZipFile zip = ZipFile.Read(file)) 
      { 
       try 
       { 
        zip.ToList().ForEach(entry => 
        { 
         if (entry.FileName.EndsWith(".doc") || 
          entry.FileName.EndsWith(".docx")) 
         { 
          // Extract file into disk 
          entry.FileName = System.IO.Path.GetFileName(entry.FileName); 
          entry.Extract(baseStoragePath); 

          // Get data from file with Parser 
          string filePath = baseStoragePath + entry.FileName; 


          // Remove extracted filess 
          if (File.Exists(filePath)) 
          { 
           File.Delete(filePath); 
           Console.WriteLine("Delete : " + filePath); 
          } 
         } 
        }); 
       } 
       catch (Exception e) 
       { 
        Console.WriteLine("Fail to unzip Exception : " + e.StackTrace); 
       } 
      } 
     } 

Я не уверен, что я могу использовать ZipEntry непосредственно, чтобы получить этот документ, может быть, мне придется распаковать его перед разбором?!

И моя цель - получить данные, расположенные после стиля «Заголовок 1» Microsoft Word, поэтому библиотека должна иметь возможность получать такие свойства.

Библиотеки идеи и примеры кода приветствуются ..

+0

Как насчет NPOI? http://npoi.codeplex.com/ –

ответ

-1

Заканчивать NPOI (A .NET Порт АФИ Apache NOI): http://npoi.codeplex.com/

или

Скачать OpenXML SDK для чтения офисных документов таких как MS Word.

+0

NPOI, смотрящий на документацию, похоже, не управляет .doc-файлами и SDK OpenXML, как это значит (.docx) не работает с .doc тоже .. – eento

Смежные вопросы