Я использовал функцию split_part в Redshift и ищу эквивалент в Hive. Я хочу разобрать URL-адреса в следующем формате. Я просмотрел функцию parse_url и не думаю, что есть вариант для того, что мне нужно. Поэтому я думаю, что мне нужна строковая функция.Разбор строки в улье
так для нижеприведенных ссылок:
www.ibm.com
www.fr.ibm.com
Я хочу, чтобы все, после WWW. В документации есть функция substring_index, которая кажется мне необходимой, но она не работает над версией Hive, которую я использую (не уверен, как проверить версию, на которой я включен)
Почему бы не просто взять все после 4-го символа или после первого появления периода? –
Вы можете использовать regexp_replace, если вы всегда хотите заменить www – Abhi
@GordonLinoff, иногда есть http, поэтому позиция символа не всегда надежна. – Moosa