2014-02-16 3 views
0

Я создаю простой веб-искатель на C++. На данный момент мне удалось получить код HTML из семенного URL-адреса, сохраненного в текстовом или строчном файле.Анализ URL-адресов из HTML-кода C++

Как найти и сохранить URL-адреса в HTML-файле Я хочу продолжить сканирование в Интернете?

+0

Разбор HTML в файлах, которые вы читаете. Примечание. Это не * тривиально. –

ответ

0

Чтобы сделать это надежно, вам нужен правильный парсер HTML. Gumbo - это парсер с открытым исходным кодом HTML5, написанный Google, который можно использовать для реализации чего-то подобного.