У меня есть таблица с двумя атрибутами id и string. Теперь в моих данных большинство строк являются повторяющиеся значения и большинство строк также разделяют те же ценности, но их порядок не так же, как показано в таблице ниже:Назначение идентификатора дублирующимся значениям в данных SQL
id | String
144 | gall stones
144 | gallstones
241 | coats tire equipment
241 | tire equipment coats
144 | google
241 | google
Теперь я хочу, чтобы добавить третий столбец который показывает, к какой строке принадлежит строка. такие как желчные камни и «желчные камни» и «желчный камень», принадлежат к тому же набору, который содержит одни и те же нити, или «шинное оборудование» и «покрышки для шин» относится к одному набору. Короче говоря, я хочу создать следующую таблицу, используя mysql или java или любым простым способом. Как мои данные имеют 3,5 миллиона записей.
id | String | Set
144 | gall stones | s1
144 | gallstones | s1
241 | coats tire equipment | s2
241 | tire equipment coats | s2
144 | google | s3
241 | google | s3
Предполагаемый заказ вы намерены использовать, неясно. Можете ли вы предоставить запрос, который генерирует записи в том порядке, который вы хотите в своем выходе (отсутствует столбец 'Set')? –