2011-02-07 2 views
1

Я достал набор статей из Википедии в формате html из Интернета. Мне нужно извлечь простой текст, описывающий статью и категории информации, к которой принадлежит статья?Извлечь текст и информацию о категориях статей из Википедии со страницы html

+1

Добро пожаловать на SO. Каков ваш вопрос и что вы уже пробовали? –

ответ

1

Если вы хотите захватить категории, проще использовать API, чем анализировать HTML.

В API документирован здесь: http://en.wikipedia.org/w/api.php

Смежные вопросы