2016-06-15 3 views
0

Интересно, почему нет хорошего соответствия между двумя изображениями с помощью SIFT. Соответствующие изображения показаны ниже. enter image description here Оригинальные изображенияСопоставление функциональных точек с использованием SIFT между двумя изображениями

enter image description here

enter image description here

Моя программа выглядит следующим образом.

int imagematching(Mat &img1, Mat & img2, std::vector<Point2f> &first_keypoints, std::vector<Point2f> &second_keypoints){ 
    int max_keypoints = 500; 

    Ptr<SIFT> detector = SIFT::create(); 
    Ptr<SIFT> extractor = SIFT::create(); 

    //--Step 1: Key point detection 
    std::vector<KeyPoint> keypoints1, keypoints2; 
    //-- Step 2: Calculate descriptors (feature vectors) 
    Mat descriptors1, descriptors2; 

    detector->detect(img1, keypoints1); 
    detector->detect(img2, keypoints2); 

    extractor->compute(img1, keypoints1, descriptors1); 
    extractor->compute(img2, keypoints2, descriptors2);  

    FlannBasedMatcher matcher; 


    vector<DMatch> matches; 
    matcher.match(descriptors1, descriptors2, matches); 

    double max_dist = 0; double min_dist = 999999; 

    //-- Quick calculation of max and min distances between keypoints 
    for(int i = 0; i < descriptors1.rows; i++) 
    { 
     double dist = matches[i].distance; 
     if(dist < min_dist) min_dist = dist; 
     if(dist > max_dist) max_dist = dist; 
    } 

    printf("-- Max dist : %f \n", max_dist); 
    printf("-- Min dist : %f \n", min_dist); 
    //-- Draw only "good" matches (i.e. whose distance is less than 3*min_dist) 
    std::vector<DMatch> good_matches; 

    for(int i = 0; i < descriptors1.rows; i++) 
    { 
     if(matches[i].distance < 3*min_dist) 
     { good_matches.push_back(matches[i]); } 
    } 
    matches.clear(); 

    Mat img_matches; 
    drawMatches(img1, keypoints1, img2, keypoints2, 
       good_matches, img_matches, Scalar::all(-1), Scalar::all(-1), 
       vector<char>(), DrawMatchesFlags::NOT_DRAW_SINGLE_POINTS); 

    descriptors1.release(); 
    descriptors2.release(); 

    //-- Localize the object 
    //std::vector<Point2f> first_keypoints; 
    //std::vector<Point2f> second_keypoints; 

    for(int i = 0; i < good_matches.size(); i++) 
    { 
     //cout << i << " :"; 
     //-- Get the keypoints from the good matches 
     if(keypoints1[ good_matches[i].queryIdx ].pt.x > 0 && keypoints1[ good_matches[i].queryIdx ].pt.y > 0 
       && keypoints2[ good_matches[i].trainIdx ].pt.x > 0 && keypoints2[ good_matches[i].trainIdx ].pt.y > 0){ 
      first_keypoints.push_back(keypoints1[ good_matches[i].queryIdx ].pt); 
      //cout << "first point" << keypoints1[ good_matches[i].queryIdx ].pt << endl; 

      second_keypoints.push_back(keypoints2[ good_matches[i].trainIdx ].pt); 
      //cout << "second point" << keypoints2[ good_matches[i].trainIdx ].pt << endl; 
     } 
    } 
    keypoints1.clear(); 
    keypoints2.clear(); 
    good_matches.clear(); 
    //-- Show detected matches 
    imshow("Good Matches & Object detection", img_matches); 
    waitKey(0); 

    return SUCCESS; 
} 
+0

SIFT/SURF/etc. обычно не являются инвариантными. Это может работать для небольших углов, но ваш объект вращается на 90 °. Как правило, для такого распознавания объектов вы используете базу данных, где есть несколько представлений одного и того же объекта под разными углами. Можете ли вы попытаться захватить один и тот же объект в виде спереди и сопоставить его с обоими этими изображениями? Возможно, угол 45 ° уже в порядке, возможно, не ... – Micka

ответ

0

SIFT может быть инвариантом вращения, но он определенно не является перспективным инвариантом. Вам нужно будет добавить некоторое машинное обучение - возможно, SVM - чтобы иметь возможность сопоставлять изображения с другой точки зрения, возможностей SIFT недостаточно.

+0

Машинное обучение не будет делать трюк в показанном случае только с одним изображением. Также должна быть * дополнительная информация *, например. как @Micka предложил использовать изображения с разных точек зрения, или путем получения/моделирования (частей) объектов 3D-формы (ML не может делать магию;)) – geekoverdose

+0

Да, у вас есть точка в этом. –

Смежные вопросы