2016-05-25 7 views
2

Есть ли способ найти все строки, содержащие арабские символы?BigQuery Найти арабские символы

У меня есть большой набор данных, и я хотел бы получить все арабские имена и обрабатывать текстовый файл по-другому, чем остальные мои данные.

Единственная потенциальная возможность, которую я прочитал, - загрузить таблицу, содержащую все арабские символы, и как-то сделать JOIN/match. Однако я бы хотел избежать этого, учитывая незнание арабского языка.

+0

В том же время, мое не очень элегантное решением является регулярным выражением для alphanumberic символов, но это не то же самое. –

ответ

4

Надеется, что вы будете наслаждаться ниже, и применить к любой логике вы должны реализовать

SELECT 
    v, 
    IFNULL(REGEXP_EXTRACT(v, r'([\p{Cyrillic}]+)'), '') AS russian, 
    IFNULL(REGEXP_EXTRACT(v, r'([\p{Arabic}]+)'), '') AS arabic, 
    IFNULL(REGEXP_EXTRACT(v, r'([\p{Hebrew}]+)'), '') AS hebrew 
FROM 
    (SELECT '12 - Table - Таблица' AS v), 
    (SELECT '23 - Table - الطاولة' AS v), 
    (SELECT '34 - Table - שולחן' AS v) 

Результат

v      russian  arabic  hebrew 
12 - Table - Таблица Таблица   
23 - Table - الطاولة    الطاولة  
34 - Table - שולחן        שולחן  
+0

Это потрясающе !!!!!! –

+0

Маленький нит (как носитель русского и иврита): Правильный перевод «Таблица» на иврит - «טַבלָה». Слово «שולחן» означает «стол» :) –

+0

: o) Я думаю, когда я помещал этот пример, я хотел использовать Стол как стол. Но почему-то закончилось с таблицей - все-таки это было прохладное быстрое упражнение: o) –

Смежные вопросы