Как разрешить сканерам доступ только к index.php, используя robots.txt?

Если я хочу только разрешить сканерам обращаться к index.php, будет ли это работать?Как разрешить сканерам доступ только к index.php, используя robots.txt?

User-agent: * 
Disallow:/
Allow: /index.php

источник

2009-10-28 todd

мне очень интересно, почему вы хотели бы сделать это ... не вы хотите Искатели индексировать гораздо больше вашего сайта? –

Вы можете использовать Google Robots tool для оформления заказа. Я никогда не ставил бы никаких секретных каталогов в файл robots, так как я бы предположил, что строка, подобная ниже, будет медом для определенных пауков.

Disallow: /secret

источник

2009-10-28 14:36:33 Janco

Попробуйте поменять порядок Disallow/Allow:

User-agent: * 
Allow: /index.php 
Disallow:/

Смотрите эту информацию из Википедии:

«Тем не менее, для того, чтобы быть совместимым со всеми роботов, если вы хотите разрешить одиночные файлы в каталоге, отличном от нулевого , вам необходимо сначала поместить директиву Разрешить , а затемDisallow, например:»

http://en.wikipedia.org/wiki/Robots.txt

Еще бы я не ожидал, что работать слишком последовательно

источник

2009-10-28 14:38:00 UpTheCreek

Да, он будет работать. Вот результат теста от Google Webmaster Tool.

Url 
http://www.example.org/index.php 

Googlebot 
Allowed by line 3: Allow: /index.php 

Googlebot-Mobile 
Allowed by line 3: Allow: /index.php

Однако помните, что при такой конфигурации вашего сайта страница не будет сканироваться, если страница не доступна с полным квалифицированным путем. Иными словами, http://www.example.org/ запрещен, а http://www.example.org/index.php разрешен.

Если вы хотите, чтобы ваша страница была доступна, вот лучшая версия вашего файла.

User-agent: * 
Disallow:/
Allow: /index.php 
Allow: /$

источник

2009-10-30 11:44:33

Не могли бы вы объяснить, почему работает/$ или что он делает? –

Пояснение для '/ $' можно найти здесь [http://stackoverflow.com/a/29475539/1973409) –

User-agent: * 

Allow: /index.php 
Disallow:/

источник

2011-03-02 11:42:17 bulava

User-agent: * 
Allow: /$ 
Allow: /index.php 
Allow: /sitemap.xml 
Allow: /robots.txt 
Disallow:/

Sitemap: http://www.your-site-name.com/sitemap.xml

источник

2014-08-04 00:48:52 mRGogo

Не могли бы вы объяснить свой ответ? – Qix

Как разрешить сканерам доступ только к index.php, используя robots.txt?

ответ

Смежные вопросы