В настоящее время я работаю над проектом на работе (я стажер), который, как ожидается, займет у меня несколько недель. Это в основном миграция и вставка задания с одного сайта на другой. Чтобы сэкономить время, скуку и, возможно, получить себе работу (если я смогу это сделать своевременно), я ищу способы автоматизации процесса. В настоящее время я определил каждый шаг в этом процессе, кроме одного.Извлечение данных из файла HTML (VBA?)
В принципе, у меня есть другая программа автоматизации, загружающая html-файл и конвертирующая его в текстовый файл для каждой страницы на сайте, которая должна быть скопирована на новую (более 1000). То, что мне нужно сделать с этим html-файлом, - это извлечь только тело, я определил начальную и конечную точку для извлечения из. Оба они отображаются во всех html-файлах.
В настоящее время я пытаюсь использовать VBA в excel, чтобы открыть файл, извлечь данные и записать результат в новый файл, отсюда я могу автоматизировать процесс копирования и вставки.
Я не могу понять, как извлечь данные между этими двумя точками. Я могу извлечь данные между двумя строками, то есть «Пуск» & «Конец», однако, я не могу извлечь данные между двумя тегами html. Любые предложения были бы фантастическими. Я не программист, и я учусь на лету, чтобы завершить этот проект как можно скорее.
Еще раз спасибо.
Если вы можете делать 'start' и' end', почему вы не можете сделать '
' и ''? Добро пожаловать в Stack Overflow - люди в целом ценят, что вы публикуете код, который вы уже пробовали решить с помощью ... –