2010-06-25 1 views
2

Я пишу набор функций для создания файла Sitemap для сайта. Предположим, что сайт - это блог.вопрос о файлах Sitemap и их содержимом для динамического веб-сайта

Определение карты сайта состоит в том, что в ней перечислены страницы, доступные на веб-сайте. Для динамического веб-сайта эти страницы меняются довольно регулярно.

Используя пример блога, «страницы» будут сообщениями в блоге (я предполагаю), так как существует ограничение на количество ссылок в карте сайта (игнорируйте индексы сайта Sitemap на данный момент), это означает, что я не могу добавить список последних сообщений в блоге, потому что в какой-то момент в будущем предел будет превышен.

В приведенном выше абзаце я сделал два (весьма фундаментальных) предположения. К ним относятся:

Предположение 1:

карта сайта содержит список страниц веб-сайта. Для динамичного веб-сайта, такого как блог, страницы будут стать блогами. поэтому я могу создать карту сайта, которая просто перечисляет blogposts на веб-сайте. (Это звучит как корм для меня)

Предположение 2:

поскольку существует жесткое ограничение на количество ссылок в файле карты сайта, я могу наложить некоторые произвольном предел N, и просто генерировать файл периодически, в список последние N · блог, · (на данном этапе, это ничем не отличается от питания)

Моих вопросов, то есть:

  • ли предположение (то есть мое понимание того, что происходит внутри файла с картой сайта) va крышка/правильно?
  • То, что я описал выше, очень похоже на фид, может ли боты не просто использовать фид для индексации веб-сайта (т. Е. Необходима карта сайта)?
  • Если я уже создаю файл с последними изменениями в нем, я не вижу смысла добавлять в файл протокола Sitemap файл - может кто-нибудь объяснить это?

ответ

1

Успение 1 является правильным - карта сайта действительно должна быть списком страниц на сайте - в вашем случае, да, это будут записи в блогах и любые другие страницы, такие как страница контакта, домашняя страница, о странице и т. д., которые у вас есть.

Да, это немного похоже на фид, но в фиде обычно есть только самые последние предметы, а на карте сайта должно быть все.

От Google's docs:

Sitemaps особенно полезны, если:

  • Ваш сайт имеет динамическое содержание.
  • На вашем сайте есть страницы, которые не легко обнаружить робот Googlebot во время процесса обхода контента, например страницы с богатым AJAX или изображениями.
  • Ваш сайт новый и имеет несколько ссылок на него. (Googlebot сканирует Интернет, следуя ссылкам с одной страницы на другую, поэтому, если ваш сайт не очень хорошо связан, нам может быть трудно обнаружить его.)
  • На вашем сайте имеется большой архив страниц с содержанием, которые недостаточно хорошо связаны друг с другом или не связаны вообще.

Допущение 2 немного неправильно - Предел для файла карты сайта 50.000 ссылки/10MB несжатого, если вы думаете, что вы, вероятно, достиг этого предела, то начните с создания файла индекса сайта, который только ссылки на одну карту сайта, а затем добавить к ней, когда вы идете.

Google будет принимать RSS-канал как карту сайта, если это все, что у вас есть, но указывает, что в них обычно содержатся только самые последние ссылки. Значение в карте сайта заключается в том, что она должна охватывать все на сайте, а не просто самые последние предметы, которые, вероятно, наиболее открываются.

Смежные вопросы