подсчет числа уникальных элементов

Привет, поэтому я должен посчитать количество уникальных элементов после сортировки массива, исключая дубликаты, но я получаю неправильный вывод.подсчет числа уникальных элементов

In in = new In(args[0]); 
int[] whitelist = in.readAllInts(); 
Arrays.sort(whitelist); 

int count = 0; 
    for (int i = 0; i < whitelist.length; i++) { 
     if (whitelist[i] == whitelist[count]) { 
      count++; 
     } 
    } 
while (!StdIn.isEmpty()) { 
    int key = StdIn.readInt(); 
    rank(key, whitelist); 
} 
    System.out.println(count);

}}

ожидается выход: Java InstrumentedBinarySearch tinyW.txt < tinyT.txt

получили: 16

ли я подсчитать количество дубликатов или что нибудь?

источник

2015-02-18 WallyWest

Можете ли вы предоставить больше кода, чтобы проиллюстрировать проблему? Что такое «белый список»? –

Запустите программу в своей голове (действуя так, как будто вы компьютер), и вы можете понять, почему она не работает. – immibis

Это основной метод – WallyWest

int flag = 0; 
    int count = 0; 
     for (int i = 0; i < whitelist.length; i++) //Element to be checked for 
    { 
      for (int j=0; j< whitelist.length ; j++) //Loop that goes through the whole array 
     { 
       if (whitelist[i] == whitelist[j]) //checks if there are duplicates 
       { 
        flag++; // count 
       } 
     } 
    if(flag==1) //There should be only 1 instance of the element in the array and that is the element itself 
    { 
     System.out.println(whitelist[i]); //displays unique element 
     count++; // Keeps count 
    } 
}

источник

2015-02-18 03:04:43

Это был мой ответ, прежде чем вы редактировали вопрос. Этот код найдет уникальные элементы в массиве. –

Я добавил комментарии для объяснения каждой строки. код OPs использует белый список [count], который не имеет смысла, так как count - это количество копий дубликатов, и он не просматривает остальную часть массива так же, как j переменная работает в моем коде. Надеюсь, это поможет. –

Этот метод дает мне ответ 10 вместо 65 – WallyWest

Этот алгоритм подсчитывает, сколько различных уникальных чисел есть в массиве. Число, появляющееся более одного раза, будет учитываться только для 1. Я предполагаю, что это то, что вы имеете в виду, в отличие от «чисел, которые появляются ровно один раз».

Существует более тривиальный способ сделать это, как предлагается в другом ответе, но для этого требуется вложенный цикл for и, следовательно, выполняется в квадратичной сложности. Мой алгоритм ниже пытается решить проблему в линейном времени, пропорциональном размеру массива.

int uniquesFound = 0; 

// Assume that array is sorted, so duplicates would be next to another. 
// If we find duplicates, such as 12223, we will only count its last instance (i.e. the last '2') 
for (int i = 0; i < whitelist.length; i++) { 

    // If we are at the last element, we know we can count it 
    if (i != whitelist.length - 1) { 
     if (whitelist[i] != whitelist[i+1]) { 
      uniquesFound++; 
     } 
     else { 
      // Nothing! If they are the same, move to the next step element 
     } 
    } else { 
     uniquesFound++; 
    } 
}

Например, учитывая массив:

{1,2,3} это даст 3, потому что есть 3 уникальные номера

{1,2,3,3,3, 4,4,4,5} это даст 5, потому что есть еще 5 уникальных номеров

источник

2015-02-18 03:08:09 iFytil

, чтобы быть более ясным, им необходимо удалить дубликаты ключей в белом списке после сортировки. Таким образом, количество проверенных ключей должно быть меньше, чем когда дубликаты не были удалены, в соответствии с вашей логикой это кажется правильным. Но это не приводит к каким-либо результатам, просто пустое – WallyWest

Если ваш шаг сортировки также происходит для удаления дубликатов ключей, то количество уникальных элементов просто равно длине массива. Это связано с тем, что если вы удаляете повторяющиеся ключи, единственное, что осталось в массиве, это уникальные числа. – iFytil

Как напечатать количество уникальных ключей в этом случае? – WallyWest

Прежде всего, давайте посмотрим на ваш цикл:

for (int i = 0; i < whitelist.length; i++) { 
    if (whitelist[i] == whitelist[count]) { 
     count++; 
    } 
}

Вы должны сравнивать последовательные элементы в списке, например белый список [0] == whitelist [1] ?, белый список [1] == белый список [2] ?, белый список [3] == белый список [4] ?, и т. Д. Выполнение whitelist[i] == whitelist[count] не имеет смысла в этом контексте.

У вас есть два варианта:

a. Увеличивает ваш счетчик, когда вы найдете два последовательных элементы, которые равны и вычтут из общего размера массива:

for (int i = 0; i < whitelist.length - 1; i++) { 
    if (whitelist[i] == whitelist[i + 1]) { 
     count++; 
    } 
} 
int result = whitelist.length - count;

б. Измените условие, чтобы подсчитать переходы между последовательными элементами, которые не равны. Так как вы подсчет количества переходов, вам нужно добавить 1 к count в конце концов, чтобы получить число уникальных элементов в массиве:

for (int i = 0; i < whitelist.length - 1; i++) { 
    if (whitelist[i] != whitelist[i + 1]) { 
     count++; 
    } 
} 
int result = count + 1;

Обратите внимание, что в обоих случаях мы цикл только до whitelist.length - 1, так что whitelist[i + 1] не выходит за пределы.

источник

2015-02-18 03:20:34

подсчет числа уникальных элементов

ответ

Смежные вопросы