Редактировать: Первоначально я пытался быть общим, но это получилось неопределенным. Я привел более подробно ниже.Несколько выходных файлов
Я пишу сценарий, который извлекает данные из двух больших файлов CSV, одного из графиков людей и другой информации о своих графиках. Данные заминированы и объединены, чтобы в конечном итоге создать графики формата pajek для соединений с понедельниками по субботам, с седьмым графиком, представляющим все соединения за неделю со строкой 1 и 0, чтобы указать, какие дни недели будут сделаны соединениями. Этот последний график представляет собой разрыв с форматом pajek и используется отдельной программой, написанной другим исследователем.
Формат Pajek имеет большой заголовок, а затем перечисляет соединения как (vertex1 vertex2) неупорядоченные пары. Трудно хранить эти пары в словаре, потому что между двумя парами часто бывает несколько соединений в один и тот же день.
Мне интересно, какой лучший способ вывода на эти графики. Должен ли я сделать большой одиночный граф и иметь второй скрипт, деконструировать его на несколько меньших графов? Должен ли я хранить семь потоков открытым, и когда я определяю, что они связаны с ними, или мне нужно сохранить какую-либо другую структуру данных для каждого и вывести их, когда я могу (например, очередь)?
@Lonnen: важный урок здесь (один я применяю почти ежедневно). Старайтесь избегать обобщения. Подробности имеют значение. –
@ Lonnen: «Mined and Combined»? По вашему сценарию или какой-либо другой прикладной программе? –