В WEKA - программное обеспечение для интеллектуального анализа данных для данных MICROARRAY DATA, как я могу удалить избыточные кортежи из существующего набора данных? Код для удаления избыточности должен быть в JAVA.Как удалить избыточные кортежи в данных микрочипов с помощью java-программирования?
т.е., набор данных содержит данные, такие, как
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
здесь кортежи 1,4,5 являются избыточными.
Код должен вернуть следующий Избыточность REMOVED набор данных ...
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
в дополнение к предложению необходимо также выполнить равных и методы Hashcode из кортежей. в противном случае расчет избыточности будет основываться только на ссылке на объект Tuple – LiorH