2010-06-21 3 views
0

У нас возникают проблемы с UTF-8 в Solr, и вам нужно отлаживать документы, которые отправляются для индексирования. Можем ли мы это сделать?Как просмотреть документы XML, отправленные в Solr

Поиск всех найденных журналов, включенных debug="1" в приложении XML в каталоге tomcat6/Catalina. Даже попробовал Wireshark, но не кубики. Пожалуйста пожалуйста!

Все выглядит хорошо на стороне PHP, и до сих пор это работало нормально. Но международные герои превращаются в классическую головную боль.

+0

Wireshark, вероятно, не работал, так как tomcat и php находятся на одной машине. – Znarkus

+0

Если вы на Windows, вы можете попробовать Fiddler http://www.fiddler2.com –

+0

У вас есть опыт работы с Fiddler? Я попробовал это, прежде чем увидел ваш комментарий, но не смог заставить его работать. Однако не прилагал к этому больших усилий. – Znarkus

ответ

2

Убедитесь, что сторона php идеальна. Вы открыли файл xml с помощью редактора и явным образом установили кодировку в UTF8? Какова ваша системная кодировка по умолчанию? Могу поспорить, что преобразование файла из этой кодировки в UTF8 может решить проблему (например, с помощью iconv).

Поскольку Solr принимает только UTF-8. И из-за природы xml это даже только подмножество xml. Вы также можете отсканировать xml, сгенерированный с php, с помощью following code i.e. Искать недопустимые (xml) символы там ...

+0

Wow, мне очень хотелось бы, чтобы я исследовал кодировку XML больше. Кто-то проскользнул в методе, который нарушил кодировку. – Znarkus

1

Вы можете использовать Tcpmon.

Я использую его много, так как он позволяет мне видеть заголовок http и полезную нагрузку при отправке в Solr (или любое веб-приложение).

+0

Я не могу заставить его передать данные с tomcat на php, но я могу см. запрос. Используете ли вы его как с веб-приложением, так и с Solr, работающим на одном компьютере? – Znarkus

+0

Hm. Кажется, tcpmon не может отображать данные post, что делает его бесполезным для меня :( – Znarkus

+0

Tcpmon может показывать данные POST. Я просто использую его пару минут назад для отладки опубликованного обновления Solr ... –

Смежные вопросы