2011-02-01 3 views

ответ

1

’ - это кодировка UTF-8 одной закрывающей цитаты (а не апострофа), и вы интерпретируете ее как Windows-1252. Вам нужно использовать правильную кодировку (UTF-8). This link может помочь.

1

Я не использовал Nutch себя, но this page выглядит это отношение:

Чтобы включить прохождение UTF-8 символов, редактировать $ TOMCAT/CONF/server.xml. Найдите < Connector> тег для веб (искать «8080») и вставьте эту параметризацию: URIEncoding = «UTF-8», как описано в Tomcat 5 FAQ по http://tomcat.apache.org/faq/connectors.html#utf8

+0

я не думаю, что из-за кот потому что моя подсказка cmd также показывает то же самое ... – ragaa

+0

@ragaa: Как вы используете командную строку? –

+0

Я проверил с обоими терминалами (в ubuntu) и с tomcat – ragaa