Я тестировал Reppy с google.com.robots.txt, но с определенными записями это немного пошло.Reppy ведет себя странно с определенными записями
Ниже перечислены:
Disallow: /alerts/
, здесь должно быть False.
Allow: /alerts/$
, должен получить True здесь.
Я получаю True
для 1-го и False
для второй записи. Пока я получил правильные результаты с остальными элементами.
>>> import reppy
>>> from reppy.cache import RobotsCache
>>> robots = RobotsCache()
>>> rules = robots.fetch("http://google.com")
>>> rules.allowed('/search', 't')
False
>>> rules.allowed('/search/about', 't')
True
#While things are right above, they are unexpected below
>>> rules.allowed('/alerts/', 't')
True # FALSE is expected here
>>> rules.allowed('/alerts/$', 't')
False # TRUE is expected here
>>>
Я был бы признателен, если бы кто-нибудь дал мне подсказку, где можно исправить это.
Спасибо! Полностью понял это. – abT