Я работаю над программой, которая будет классифицировать файлы в группы на основе определенного текста, найденного в них. Большинство файлов, возможно, будут .doc или .docx.Поиск слов в документе офисного документа
Моя программа должна иметь возможность сравнить список слов со словами в файлах. Я новичок в C#, и я только изучаю программирование самостоятельно, и весь «прочитанный файл .doc» идет по моей голове, поэтому любая помощь будет принята с благодарностью!
До сих пор часть моего кода, который имеет дело с офисом:
КОДА
if (Path.GetExtension(listBox1.SelectedItem.ToString()) == ".doc" ||
Path.GetExtension(listBox1.SelectedItem.ToString()) == ".docx")
{
Microsoft.Office.Interop.Word.Document doc =
new Microsoft.Office.Interop.Word.Document(listBox1.SelectedItem.ToString());
doc.Activate();
}
EDIT:
Извините, если этот вопрос не был достаточно ясен. Мой вопрос:
Как я могу найти, если документ содержит какие-либо конкретные слова, содержащиеся в текстовом файле. Я прочитал много других вопросов, ответов и учебников, и это может быть только я, но я полностью не понимаю.
И вопрос? – Oscar
Не могли бы вы просто прочитать текст через обычный streamreader и совершить круиз через объект, который ищет определенные слова? – Jonesopolis
Normal streamreader не сможет понять формат файла слова, так же, как notepad.exe cant – Sayse