Я аналитик, пытающийся построить запрос, чтобы извлекать данные за последние 7 дней из таблицы в Hadoop. Сама таблица разделена по дате.Раздел запроса с расчетом и избегайте полного сканирования таблицы
Когда я тестирую свой запрос с жестко закодированными датами, все работает так, как ожидалось. Однако, когда я пишу его для расчета на основе сегодняшней метки времени, он выполняет полное сканирование таблицы, и мне пришлось убить работу.
Пример запроса:
SELECT * FROM target_table
WHERE date >= DATE_SUB(FROM_UNIXTIME(UNIX_TIMESTAMP(),'yyyy-MM-dd'),7);
Я оценил бы некоторые советы, как я могу пересмотреть свой запрос, избегая при этом полное сканирование таблицы.
Спасибо!
Спасибо Прадипа. Возможно, я тоже смогу изучить Оози. – eyy