Для анализа: Microsoft Word 97/2003 (.doc) & Microsoft Word 2007/2010 (.docx) с использованием C# и WPF без установки Word, мне нужно знать, может ли кто-либо дайте мне серьезную библиотеку, чтобы использовать ее для достижения этой цели.Универсальный анализатор документов Microsoft Word без установки Word
Технически я итерация ZipEntry элементов, используя имеющуюся так:
foreach (string file in _listPathFiles)
{
using (Ionic.Zip.ZipFile zip = ZipFile.Read(file))
{
try
{
zip.ToList().ForEach(entry =>
{
if (entry.FileName.EndsWith(".doc") ||
entry.FileName.EndsWith(".docx"))
{
// Extract file into disk
entry.FileName = System.IO.Path.GetFileName(entry.FileName);
entry.Extract(baseStoragePath);
// Get data from file with Parser
string filePath = baseStoragePath + entry.FileName;
// Remove extracted filess
if (File.Exists(filePath))
{
File.Delete(filePath);
Console.WriteLine("Delete : " + filePath);
}
}
});
}
catch (Exception e)
{
Console.WriteLine("Fail to unzip Exception : " + e.StackTrace);
}
}
}
Я не уверен, что я могу использовать ZipEntry непосредственно, чтобы получить этот документ, может быть, мне придется распаковать его перед разбором?!
И моя цель - получить данные, расположенные после стиля «Заголовок 1» Microsoft Word, поэтому библиотека должна иметь возможность получать такие свойства.
Библиотеки идеи и примеры кода приветствуются ..
Как насчет NPOI? http://npoi.codeplex.com/ –