У меня есть URL, содержащий специальные символы. Например:Должен ли я кодировать специальный символ в файлах Sitemap?
http://www.example.com/bléèàû.html
Если ввести этот URL в браузере, мой веб-сервер будет показывать правильную страницу (он может обрабатывать специальный символ).
Я просмотрел sitemaps specs, и неясно, может ли файл sitemaps содержать специальный символ. Из того, что я понимаю в протоколе, если URL-адрес работает нормально, и сервер обслуживает правильную страницу, а XML-файл кодируется в кодировке UTF-8, тогда все в порядке.
Например, эта запись является действительным запись Sitemaps:
<url>
<loc>http://www.example.com/bléèàû.html</loc>
<changefreq>weekly</changefreq>
</url>
Любой может подтвердить это?
[Обновить] Причина, по которой я не хочу кодировать специальные символы, заключается в том, что я не хочу вводить повторяющиеся URL-адреса для одного и того же контента. Например
http://www.example.com/bl%C3%A9%C3%A8%C3%A0%C3%BB.html
и
http://www.example.com/bléèàû.html
будет служить той же странице. Я предполагаю, что Google поймает оба URL с нормальным индексированием и файлами sitemaps. К сожалению, Google имеет тенденцию понижать рейтинг страниц сайтов, у которых есть повторяющиеся URL-адреса, указывающие на одну и ту же страницу.