Быстросортировать, используя двоичный файл с int с дубликатами. Возникли проблемы с рекурсией

Прежде всего, я хочу сказать, что это домашнее задание.Быстросортировать, используя двоичный файл с int с дубликатами. Возникли проблемы с рекурсией

Часто у нас будут задания, на которые я отправлю вопросы после того, как мы закончим его, и я хотел бы продолжить работу с ним, чтобы улучшить свои способности, но в этом случае я просто в тупике!

Нам было поручено реализовать quicksort с использованием двоичного файла, используя только команды file.seek, file.read и file.write. Это двоичный файл целых чисел.

Проблемы я имею рекурсию часть, вызывая функцию на «поддерева» из поворота. Я слежу за алгоритмом, изложенным на этом сайте: http://xoax.net/comp_sci/crs/algorithms/lessons/Lesson4/ и использовал пример кода в качестве псевдокода для реализации моего двоичного файла.

Вот мой код:

//Algorithm and code example used: 
void manage(fstream & file , int lindex , int fSize){ 


    //Chunks of 1 or 0 do not need sorting 
    if(fSize <= 1) 
     return; 

    //Choose point in file as "pivot." Pivot is a value. 
    //pp is the index of "pivot" 
    int pp = (rand() % fSize) + lindex; 
    file.seekp(pp * sizeof(int) , file.beg); 
    int pivot; 
    file.read((char*)&pivot , sizeof(int)); 

    //Choose "indices" to be swapped. These will be used in seekp 
    int leftIndex = lindex; 
    int rightIndex = fSize - 1; 

    //Swap val , swap val, temp storage, swap index 1 , swap index 2 
    int leftSwap , rightSwap , temp , tempI1 , tempI2 = 0; 

    //Dummy indecies to help with tracking partitions. 
    int dumL = leftIndex; 
    int dumR = rightIndex; 

    while(dumL < dumR){ 

     //Move to left index from the file beginning. 
     file.seekp(dumL * sizeof(int) , file.beg); 

     do{ 

      tempI1 = file.tellp()/sizeof(int); 
      dumL = tempI1; 
      file.read((char*)&temp , sizeof(int)); 
     } 

     while(temp < pivot); 

     leftSwap = temp; 

     //Move to right index. 
     file.seekp(dumR * sizeof(int) , file.beg); 
     int n = 1; 

     do{ 

      tempI2 = file.tellp()/sizeof(int); 
      dumR = tempI2; 
      file.read((char*)&temp , sizeof(int)); 
      file.seekp((rightIndex - n) * sizeof(int) , file.beg); 
      n++; 
     }   

     while(temp > pivot); 

     rightSwap = temp; 

     //Swap values 
     int hold = 0; 

     if(leftSwap == rightSwap && rightSwap == pivot) 
      break; 

     file.seekp(tempI1 * sizeof(int) , file.beg); 
     file.read((char*)&hold , sizeof(int)); 

     file.seekp(tempI1 * sizeof(int) , file.beg); 
     file.write((char*)&rightSwap , sizeof(int)); 

     file.seekp(tempI2 * sizeof(int) , file.beg); 
     file.write((char*)&leftSwap , sizeof(int)); 
    } 

    cout << "pp: " << pp << endl; 
    cout << "dumL: " << dumL << endl; 
    cout << "dumR: " << dumR << endl << endl; 

    //cout << "Lmanage: \n\t Lindex: 0\n\tSize: " << dumL << endl; 
    manage(file , 0 , dumL); 
    //cout << "Rmanage: \n\t Lindex: " << dumL + 1 << "\n\tSize: " << fSize - dumL - 1 << endl; 
    manage(file , dumL + 1 , fSize - (dumL - leftIndex) - 1); 
} 


void quicksort(fstream & file , int iSize){ 

    srand((unsigned int) time(0)); 
    manage(file , 0 , iSize); 
} 


int main(int argc, char* argv[]){ 

    if(argc != 2){ 

     cout << "Invalid number of arguments.\n"; 
     return -1; 
    } 

    fstream file; 
    int x = 0; 

    file.open(argv[1] , ios::binary | ios::out | ios::in); 

    //Calculate number of ints in file. 
    file.seekg(0 , file.end); 
    int size = file.tellg()/sizeof(int); 

    cout << "size: " << size << endl; 

    quicksort(file , size); 

    return 0; 
}

"Арг" представляет собой двоичный файл, содержащий 100 целых чисел, с возможными дубликатами. Проблема в том, что он, кажется, сортирует первый 1/4, но индексирование смешивается, а аргумент «размер» отрицателен.

Edit: Добавлен мой основной и обновляется с изменениями от комментариев.

источник

2013-04-22 Joshua

Для начала, остановки высева вашего ГСЧА с каждой рекурсией слоем. 'srand()' должен быть в вашем запуске программы; нигде более. Во-вторых, распространенной ошибкой в быстрых реализациях сортировки является отказ SKIP в слоте поворота после его размещения при переходе в подпоследовательности. Посмотрите на свой код * очень внимательно, чтобы убедиться, что вы не совершаете ту же ошибку. Стержень не должен включаться в * либо * подпоследовательностей, которые повторяются. – WhozCraig

Кроме того, не передавайте имя файла в 'manage()'; передайте открытую ссылку 'fstream'. Вам не нужны все эти дескрипторы файлов, и у вас возникнут проблемы с совместным использованием. – WhozCraig

Я думал, что сделал это, и сделал изначально, но в итоге я получил большую ошибку, которую я не понял. Я предположил, что мне не разрешено передавать открытые файлы в качестве аргумента. – Joshua

Я понимаю, что встроенный алгоритм qsort не может быть популярным выбором, но делает этот конкретный экземпляр более понятным. Смотрите следующее:

#include <iostream> 
#include <fstream> 
#include <vector> 
#include <cstdlib> 
#include <random> 
using namespace std; 

static void quicksort_stream(std::iostream& st, 
          std::ios::off_type left, // inclusive 
          std::ios::off_type right, // exclusive 
          unsigned int indent=0) 
{ 
    std::ios::off_type len = (right - left); 
    if (len <= 1) 
     return; 

    // an interesting way of looking at the sort. 
    std::string sIndent(indent,' '); 
    cerr << sIndent << left << ',' << right << endl; 

    // choose a random pivot index form our range: 
    std::ios::off_type pivot_idx = left + std::rand() % (len-1); 

    // get the pivot value, then swap the *last* value in our 
    // range into the pivot slot. it will be putting the pivot 
    // value in when were done. 
    int pivot = 0, val = 0; 
    st.seekg(pivot_idx * sizeof(int), ios::beg); 
    st.read((char*)&pivot, sizeof(int)); 
    st.seekg((right-1) * sizeof(int), ios::beg); 
    st.read((char*)&val, sizeof(int)); 
    st.seekg(pivot_idx * sizeof(int), ios::beg); 
    st.write((char*)&val, sizeof(int)); 

    // now start the partition scan. 
    pivot_idx = left; 
    for (std::ios::off_type i=left; i<(right-1);++i) 
    { 
     st.seekg(i * sizeof(int), ios::beg); 
     st.read((char*)&val, sizeof(int)); 
     if (val < pivot) 
     { 
      // swap the current selection with whatever is at 
      // the curent pivot index. 
      int val2 = 0; 
      st.seekg(pivot_idx * sizeof(int), ios::beg); 
      st.read((char*)&val2, sizeof(int)); 
      st.seekg(i * sizeof(int), ios::beg); 
      st.write((char*)&val2, sizeof(int)); 
      st.seekg(pivot_idx * sizeof(int), ios::beg); 
      st.write((char*)&val, sizeof(int)); 
      ++pivot_idx; 
     } 
    } 

    // store the pivot value back at the pivot index, 
    // placing that value in the last slot of the partition. 
    st.seekg(pivot_idx * sizeof(int), ios::beg); 
    st.read((char*)&val, sizeof(int)); 
    st.seekg((right-1) * sizeof(int), ios::beg); 
    st.write((char*)&val, sizeof(int)); 
    st.seekg(pivot_idx * sizeof(int), ios::beg); 
    st.write((char*)&pivot, sizeof(int)); 

    // and finally,invoke on subsequences. skipping the pivot index 
    quicksort_stream(st, left, pivot_idx, indent+1); 
    quicksort_stream(st, pivot_idx+1, right, indent+1); 
} 

int main(int argc, char *argv[]) 
{ 
    if (argc < 2) 
     return EXIT_FAILURE; 

    // create a vector of 100 random int values in [1,1000] 
    std::vector<int> vals; 

    // build generator 
    std::random_device rd; 
    std::mt19937 rgen(rd()); 
    std::uniform_int_distribution<> dist(0, 999); 
    std::generate_n(std::back_inserter(vals), 100, [&dist,&rgen](){ return dist(rgen); }); 

    // open the output file and dump this to that location. 
    std::fstream fs(argv[1], ios::out|ios::binary); 
    fs.write((const char*)vals.data(), vals.size() * sizeof(vals[0])); 
    fs.flush(); 
    fs.close(); 

    // now open the stream and sort it 
    fs.open(argv[1], ios::in|ios::out|ios::binary); 
    quicksort_stream(fs, 0, 100); 
    fs.flush(); 
    fs.close(); 

    // clear the content of the exiting vector. 
    std::fill(vals.begin(), vals.end(), 0); 
    fs.open(argv[1], ios::in|ios::binary); 
    fs.read((char *)vals.data(), vals.size() * sizeof(vals[0])); 
    cout << endl << "Sorted" << endl; 
    std::copy(vals.begin(), vals.end(), std::ostream_iterator<int>(cout, "\n")); 

    return 0; 
}

Я включил механизм рекурсивного отступа «печати» в этом, чтобы продемонстрировать характер и сортировки, как это работает. Ниже приведен пример вывода пробега. Надеюсь, это поможет вам.

Пример вывод

источник

2013-04-22 06:06:30 WhozCraig

Ничего себе, что было больше, чем я искал. Огромное спасибо. Надеюсь, я смогу понять, что я делал неправильно с этим. – Joshua

@Joshua Его просто другой под-алгоритм quicksort, двухсторонний подход покупает вам один атрибут, которого нет у одного. Он заменяет два элемента, которые, как известно, находятся в противоположных последовательностях, а не перемещаются по мере необходимости. В конечном счете, O (nlogn) все тот же, просто * потенциально * меньше движения. Как я уже сказал, я предпочитаю этот алгоритм только потому, что его гораздо легче понять, особенно при обучении людей быстрой сортировке. Надеюсь, вы согласитесь. – WhozCraig

Быстросортировать, используя двоичный файл с int с дубликатами. Возникли проблемы с рекурсией

ответ

Смежные вопросы