2017-02-06 3 views
6

Я ищу способ получить HAVERSINE() в BigQuery. Например, как получить самые близкие метеостанции к произвольной точке?HAVERSINE расстояние в BigQuery?

+0

исх: https://twitter.com/joaocorreia/status/827638555035840512 –

ответ

6

Использование standard SQL вы можете определить функцию SQL для инкапсулирования логики. Например,

#standardSQL 
CREATE TEMP FUNCTION RADIANS(x FLOAT64) AS (
    ACOS(-1) * x/180 
); 
CREATE TEMP FUNCTION RADIANS_TO_KM(x FLOAT64) AS (
    111.045 * 180 * x/ACOS(-1) 
); 
CREATE TEMP FUNCTION HAVERSINE(lat1 FLOAT64, long1 FLOAT64, 
           lat2 FLOAT64, long2 FLOAT64) AS (
    RADIANS_TO_KM(
    ACOS(COS(RADIANS(lat1)) * COS(RADIANS(lat2)) * 
     COS(RADIANS(long1) - RADIANS(long2)) + 
     SIN(RADIANS(lat1)) * SIN(RADIANS(lat2)))) 
); 

SELECT 
    lat, 
    lon, 
    name, 
    HAVERSINE(40.73943, -73.99585, lat, lon) AS distance_in_km 
FROM `bigquery-public-data.noaa_gsod.stations` 
WHERE lat IS NOT NULL AND lon IS NOT NULL 
ORDER BY distance_in_km 
LIMIT 4; 
2

решение Наследство SQL (стандарт заявлен):

SELECT lat, lon, name, 
    (111.045 * DEGREES(ACOS(COS(RADIANS(40.73943)) * COS(RADIANS(lat)) * COS(RADIANS(-73.99585) - RADIANS(lon)) + SIN(RADIANS(40.73943)) * SIN(RADIANS(lat))))) AS distance 
FROM [bigquery-public-data:noaa_gsod.stations] 
HAVING distance>0 
ORDER BY distance 
LIMIT 4 

enter image description here

(на основе http://www.plumislandmedia.net/mysql/haversine-mysql-nearest-loc/)

+0

Со стандартным SQL можно поставить логику в SQL UDF вместо того, чтобы поместить его непосредственно в тело запроса. –

+0

Я знаю! Я сделал быструю попытку, но тогда мне не хватало DEGREES() и RADIANS(). Оставленный запрос не ожидается, пока я не выясню эквивалентные преобразования, в том числе отсутствие PI(). Но я вернусь :) –

+0

Кстати - это даст расстояние в км –

Смежные вопросы