2011-01-24 3 views

ответ

4

Это более сложный вопрос, который возник, когда я спросил его, но простой ответ заключается в том, что вы полностью нормализуете свою базу данных. После того, как он полностью нормализован, каждая таблица обозначает предикат, значения столбцов представляют объект, а одно значение столбца представляет объект. Вы можете преобразовать произвольную базу данных sql в triplestore на этой основе.

+0

Это кажется удивительным. Это правда? :-) ... хорошо, правда, как в: можете ли вы привести бумагу или ссылку или что-то еще? Благодаря! – Benjohn

+0

Нет, я ничего не могу называть, насколько мне известно, это оригинально. Это можно сделать другими способами (т. Е. 1 большая таблица с тремя столбцами, A, B и тип отношения между ними). Но когда вы глубоко задумываетесь о том, что такое таблица, вы понимаете, что она может стоять за тип отношений (или нет, как хотелось бы). – tjb

2

Функция преобразования утроить преобразования любого вида реляционных данных в тройной формат:

def transform_to_triple(source,db_name,table,result): 
    #get the list of relations for the selected DB 
    max_records = 100 
    response = [] 
    x_print = lambda *x : response.append("(%s)\n" %("".join(["%s"%(v) for v in x]))) 

    id = 1 

    x_print(id,',(db_name:string),',db_name) 
    logger.info("(%s,(db_name,string), %s)" %(id,db_name)) 

    tables = [] 
    table_list = [table,] 
    for i, _table in enumerate(table_list): 
     _table_id = id + i + 1 
     x_print(id,',(rel:id),', _table_id) 
     logger.info("(%s,(rel, id), %s)" %(id, _table_id)) 

     _schema = get_column_list(source, db_name,_table) 
     tables.append((_table_id, _table, _schema)) 
    for _table in tables: 
     _table_id = _table[0] 
     x_print(_table_id,',(rel_name:string),',_table[1]) 
     for j,row in enumerate(result): 
      #lets assume there is always less than 10 k tuples in a table 
      _tuple_id = _table_id * max_records + j + 1 
      x_print(_table[0],',(tuple:id),', _tuple_id) 
      logger.info("(%s,(tuple, id), %s)" %(_table[0],_tuple_id)) 
     for j,row in enumerate(result): 
      _tuple_id = _table_id * max_records + j + 1 
      for k,value in enumerate(row): 
       x_print(_tuple_id, ",(%s : %s)," %(_table[2][k][0], _table[2][k][1]), value) 
    return "%s" %("".join(response)) 

функция get_column_list возвращает список столбцов в пределах таблиц базы данных:

def get_column_list(src_name,db_name,table_name): 
    cur = get_connect() #Connecting with tool DB 
    query = '''select db_name, host, user_name, password from "DataSource" where src_name = '%s' and db_name = '%s' '''%(src_name, db_name) 
    cur.execute(query) 
    data = cur.fetchall() 
    (db, host, username, password) = data[0] 
    _module = get_module(src_name) 
    cursor = _module.get_connection(db, host, username, password) 
    try: 
      _column_query = _module.COLUMN_LIST_QUERY %(db_name, table_name) 
    except TypeError, e: 
      try: 
       _column_query = _module.COLUMN_LIST_QUERY %(table_name) 
      except TypeError, e: 
       _column_query = _module.COLUMN_LIST_QUERY 

    cursor.execute(_column_query) 
    column_list = cursor.fetchall() 
    return column_list 
+0

Есть кнопка для голосования, но не такая кнопка! Я хочу любить. – Benjohn

Смежные вопросы