Как известно, современный самый популярный CNN (сверточная нейронная сеть): VGG/RESNET (FasterRCNN), SSD, Yolo, Yolo v2, DenseBox, DetectNet - не вращается инвариант: Are modern CNN (convolutional neural network) as DetectNet rotate invariant?Почему ротационно-инвариантные нейронные сети не используются в победителях популярных конкурсов?
Также известно, что существует несколько нейронные сети с обнаружением объекта Rotate-инвариантность:
вращательно-инвариантная Neoperceptron 2006 (PDF): https://www.researchgate.net/publication/224649475_Rotation-Invariant_Neoperceptron
Изучение вращения инвариантных сверточных фильтров для классификации текстур 2016 (PDF): https://arxiv.org/abs/1604.06720
RIFD-CNN: Вращение-инвариантные и Фишер дискриминационный сверточные нейронные сети для обнаружения объекта 2016 (PDF): http://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Cheng_RIFD-CNN_Rotation-Invariant_and_CVPR_2016_paper.html
Закодированной инвариантность в сверточноге нейронных сетях 2014 (PDF)
Ротационно-инвариантные сверточные нейронные сети для прогнозирования морфологии галактик (PDF): https://arxiv.org/abs/1503.07077
обучение Rotation-Инвариантная сверточные нейронные сети для обнаружения объектов в VHR оптических изображений дистанционного зондирования 2016 года: http://ieeexplore.ieee.org/document/7560644/
Мы знаем, что в таких соревнованиях изображений обнаружения как: IMAGE-NET, MSCOCO, PASCAL ЛОС - используются сети ансамбли (одновременно некоторые нейронные сети). Или сетевые ансамбли в единой сети, такие как ResNet (Residual Networks Behave Like Ensembles of Relatively Shallow Networks)
Но используются ротационно-инвариантные сетевые ансамбли в победителях, таких как MSRA, а если нет, то почему? Почему в ансамбле дополнительная чередово-инвариантная сеть не добавляет точности для обнаружения определенных объектов, таких как объекты самолетов, - какие изображения выполняются под разными углами поворота?
Это может быть:
Почему вращения -инвариантные нейронные сети не используются в победителях по соревнования по обстрелу соломы?
Во многих соревнованиях люди анализируют каждый класс и его возможные повороты. Картина самолета в небе может иметь все возможные вращения, но горизонтальная картина собаки не работает. И они генерируют новые обучающие изображения из оригинальных с каждым возможным вращением. Может быть, это более точно, чем алгоритм с вращающимся инвариантом. Другое возможное объяснение заключается в том, что есть очень эффективные библиотеки для запуска CNN на графических процессорах (я не знаю, есть ли эффективные библиотеки на графических процессорах для вращения инвариантных нейронных сетей). – Rob
@Rob ** 1. ** Да, поворот-инвариантный подход может использоваться только для аффинного преобразования (для обнаружения воздушных объектов из земли или наземных объектов из воздуха), но не для эллиптического преобразования (для обнаружения животных), а не для вращений вокруг оси вне плоскости съемки. Но rotate-invant-CNN можно использовать в дополнение к обычной сверточной сети в ансамблях. Поворот-инвариант-CNN требует гораздо меньше входных изображений и настраиваемых параметров - и, следовательно, быстрее и точнее учится (для наиболее подходящих объектов) – Alex
@Rob ** 2. ** О графическом процессоре. 5. Реляционно-инвариантные сверточные нейронные сети для предсказания морфологии галактик: «7.9 Реализация ... Это позволило использовать ускорение GPU без каких-либо дополнительных усилий ... Сети были , обученные на картах NVIDIA GeForce GTX 680.' https: // arxiv .org/pdf/1503.07077v1.pdf Также может быть поворот-инвариант 'cv :: SURF_GPU' каким-то образом может использоваться вместо свертки-ядра (матрицы). – Alex