У меня есть пакет scala/spark, который работает в базе данных Hive. Он запускает цикл, в котором запрос выполняется, чтобы проверить, существует ли данные для некоторых конкретных значенийУлей - быстрый способ проверки данных
SELECT * FROM myTable WHERE col1 = 7879 AND col2= 1071 AND col3= 3027 LIMIT 1;
Затем действуйте на основе возвращает ли он или нет строки. Выполнение занимает около 25 секунд.
Я видел, что этот способ работает быстрее, чем
SELECT COUNT(*) FROM myTable WHERE col1 = 7879 AND col2= 1071 AND col3= 3027;
и производства на основе наличия или отсутствия графа 0.
Есть ли более быстрый способ проверить, существует ли данные в таблице для определенных ограничений?
EDIT - Петля запускается на основе результирующих строк другого запроса (в результате получается более 100 строк).
Проверить обновленный ответ –