Предположим, у меня есть документ слова о том, что содержание, как нижеИзвлечение указанной информации из Microsoft Word
Name: Blabla1
Address: Blablabla2
History Employment: Blablabla3
Blablabla4
Blablabla5
И мои вопросы здесь, как и то, что алгоритм (если есть), чтобы извлечь эту информацию в классе в C#.
Class Employee {
public string Name { get; set; }
public string Address { get; set; }
public IEnumerable<string> History = new IList<string>();
}
Любое предложение?
var Employee = ExtractMethodFromDoc(docPath);
преобразование в другой формат может быть не лучшим решением, нет грантодателя, что вся информация сохраняется во время преобразования. – David
@ David Я искал его, но не нашел альтернативы, извините, см. Этот дополнительный SDK, если он полезен >> http://openxmldeveloper.org/discussions/development_tools/f/17/t/5992.aspx – Freelancer
ваш комментарий слишком велик, сильно не согласен, простите меня за это, :). Вам не нужно использовать скрипт, например, powershell. Например, в Visual Studio вы можете использовать настройки уровня документа (см. Http://msdn.microsoft.com/en-us/library/aa942839.aspx) для доступа ко всему содержимому слова doc, тогда это не слишком сложно для синтаксического анализа текста в виде структуры, например экземпляров классов, содержащих требуемую информацию. – David