После того, как вы построили структуру данных, точно, какие запросы вы хотите запустить против него? Покажите нам свой существующий код. Что такое T (x)? Вы говорите о «группах чисел», но ваши данные показывают T1, T2 и т. Д .; пожалуйста, объясни.
Вы читали это: http://en.wikipedia.org/wiki/Disjoint-set_data_structure
Попробуйте посмотреть на этой реализации Python: http://code.activestate.com/recipes/215912-union-find-data-structure/
ИЛИ вы можете наброситься на что-то довольно просто и понятно себя, например,
[Update: совершенно новый код]
class DisjointSet(object):
def __init__(self):
self.leader = {} # maps a member to the group's leader
self.group = {} # maps a group leader to the group (which is a set)
def add(self, a, b):
leadera = self.leader.get(a)
leaderb = self.leader.get(b)
if leadera is not None:
if leaderb is not None:
if leadera == leaderb: return # nothing to do
groupa = self.group[leadera]
groupb = self.group[leaderb]
if len(groupa) < len(groupb):
a, leadera, groupa, b, leaderb, groupb = b, leaderb, groupb, a, leadera, groupa
groupa |= groupb
del self.group[leaderb]
for k in groupb:
self.leader[k] = leadera
else:
self.group[leadera].add(b)
self.leader[b] = leadera
else:
if leaderb is not None:
self.group[leaderb].add(a)
self.leader[a] = leaderb
else:
self.leader[a] = self.leader[b] = a
self.group[a] = set([a, b])
data = """T1 T2
T3 T4
T5 T1
T3 T6
T7 T8
T3 T7
T9 TA
T1 T9"""
# data is chosen to demonstrate each of 5 paths in the code
from pprint import pprint as pp
ds = DisjointSet()
for line in data.splitlines():
x, y = line.split()
ds.add(x, y)
print
print x, y
pp(ds.leader)
pp(ds.group)
и вот выход из последнего шага:
T1 T9
{'T1': 'T1',
'T2': 'T1',
'T3': 'T3',
'T4': 'T3',
'T5': 'T1',
'T6': 'T3',
'T7': 'T3',
'T8': 'T3',
'T9': 'T1',
'TA': 'T1'}
{'T1': set(['T1', 'T2', 'T5', 'T9', 'TA']),
'T3': set(['T3', 'T4', 'T6', 'T7', 'T8'])}
В чем смысл строк только с одним номером? Группа одного номера? –
Предлагаю посмотреть ответы, в которых упоминается непересекающийся набор или объединение. Эти структуры (которые реализуют union/find) используются для реализации алгоритма _incremental_ connected components. Полагаю, вы уже знали это, из названия вопроса. – 2010-06-18 11:16:25
abhin4v: yes - группа из одного числа. Я могу иметь от 1 до 100 номеров в строке, поэтому у меня могут быть группы от 1 до 100. Морон: Будет, и да, я сделал небольшое исследование перед этим вопросом, но теперь у меня есть много информации искать. :) – Mig