Мы используем платный сервис Google CSE (Custom Search Engine) для индексации содержимого на нашем веб-сайте. Сайт построен в основном на PHP-страницах, которые собраны с включенными файлами, но есть некоторые динамические страницы, которые извлекают информацию из базы данных в один шаблон страницы (например, новые выпуски). Проблема заключается в том, что я могу установить дату истечения срока содержания в базе данных, поэтому скажем, что «id = 2» приведет к уведомлению «Это содержимое истекло». Однако, если в ID 2 был добавлен загруженный PDF-файл, файл PDF остается в индексе поиска.Удаление загруженных файлов из Google, когда товар истекает
Я знаю, что могу написать сценарий очистки и запустить cron, который смотрит на db, находит истекший контент, проверяет, были ли какие-либо загруженные файлы прикреплены и либо переименовывает, либо удаляет их, но должно быть лучше решение (надеюсь).
Пожалуйста, дайте мне знать, если вы столкнулись с этим в прошлом и что вы предлагаете.
Спасибо, D.
Я не думал писать в файл роботов ... это может сработать. Файлы загружаются через сценарий загрузки, а значение хранится в БД для имени файла. Все файлы переходят в один и тот же каталог, поэтому что-то вроде http://www.domainname.com/uploads/pdffilehere.pdf будет контуром, а «pdffilehere.pdf» будет храниться в столбце «url» базы данных , – Don