2013-04-06 1 views
0

Предположим, у меня есть документ слова о том, что содержание, как нижеИзвлечение указанной информации из Microsoft Word

Name: Blabla1 
Address: Blablabla2 
History Employment: Blablabla3 
        Blablabla4 
        Blablabla5 

И мои вопросы здесь, как и то, что алгоритм (если есть), чтобы извлечь эту информацию в классе в C#.

Class Employee { 
    public string Name { get; set; } 
    public string Address { get; set; } 
    public IEnumerable<string> History = new IList<string>(); 
} 

Любое предложение?

var Employee = ExtractMethodFromDoc(docPath); 

ответ

1

MS Word полностью доступен для написания сценариев через OLE Automation.

Для этой цели нет общих библиотек в C#. Вы можете использовать стороннее приложение для преобразования в другой формат, например ASCII.

Вы также можете обратиться по этой ссылке на модуль для этой цели:

http://www.xav.com/perl/site/lib/Win32/OLE.html

Вы также можете обратиться к этой библиотеке MSDN:

http://msdn.microsoft.com/en-us/library/cc974107%28office.12%29.aspx

Вы также можете использовать этот Open XML SDK 2.0 Код ссылки ниже:

http://www.microsoft.com/en-us/download/details.aspx?id=17985

+0

преобразование в другой формат может быть не лучшим решением, нет грантодателя, что вся информация сохраняется во время преобразования. – David

+0

@ David Я искал его, но не нашел альтернативы, извините, см. Этот дополнительный SDK, если он полезен >> http://openxmldeveloper.org/discussions/development_tools/f/17/t/5992.aspx – Freelancer

+0

ваш комментарий слишком велик, сильно не согласен, простите меня за это, :). Вам не нужно использовать скрипт, например, powershell. Например, в Visual Studio вы можете использовать настройки уровня документа (см. Http://msdn.microsoft.com/en-us/library/aa942839.aspx) для доступа ко всему содержимому слова doc, тогда это не слишком сложно для синтаксического анализа текста в виде структуры, например экземпляров классов, содержащих требуемую информацию. – David

0

вы можете использовать dll Microsoft word. создать объект слова dll и загрузить данные.

Смежные вопросы