Мне нужно заполнить базу данных набором $ CSV-файлов, строкой хеш-таблицы $ string, md5 ($ string).Первичный ключ таблицы поиска хэша
Мой вопрос: Следует ли использовать строку в качестве Первичного ключа? Хеш? Добавить дополнительный столбец идентификатора?
Я думаю, что хэш был бы хорош, так как я буду спрашивать базу данных, но хеши могут столкнуться, Строки должны быть уникальными в любом случае (чтобы сэкономить место), но я хотел получить второе мнение по этому поводу.
Я спрашиваю с представлением о производительности, учитывая, что он будет заполнен как минимум 35 ГБ данных. Так что действительно любые предложения оценили
Вы можете ** не ** использовать столбец 'serial' для подсчета количества строк. Цифры ** не ** гарантированы без пробелов, и если вы удалите строки, эти идентификаторы будут ** не ** использоваться повторно. –
Ничего себе! Спасибо за головы, не понял этого. Однако в этом конкретном случае я не буду удалять записи. – John