2015-04-09 2 views
0

Я хочу использовать Boilerpipe для извлечения текста из страницы новостей на нескольких веб-сайтах, проблема в том, что каждый раз, когда я пытаюсь это сделать, я получаю ошибку ConnectionException. я просто использовал пример синтаксис из boilerpipe quickstart guide:Как решить ошибку ConnectException при использовании Boilerpipe?

URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html"); 
String text = ArticleExtractor.INSTANCE.getText(url); 

А вот ошибка соединения:

de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect 
    at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89) 
    at extract.Test.main(Test.java:14) 
Caused by: java.net.ConnectException: Connection refused: connect 

Я попытался с большим количеством сайтов, но речь идет о той же ошибке.

Как решить эту проблему или, по крайней мере, увидеть, где проблема? (возможно, межсетевой экран или конфигурации портов ...)

ответ

0

После дальнейших исследований я узнал, что это брандмауэр на предприятии, который блокировал эти запросы.