2016-07-28 2 views
3

Я знаю, что существует много API распознавания зрения, таких как Clarifai, Watson, Google Cloud Vision, Microsoft Cognitive Services, которые обеспечивают распознавание содержимого изображения. Реакция этих услуг является простой JSON, который содержит различные теги, напримерКак получить позицию пользовательского объекта на изображении с помощью распознавания зрения api

{ 
    man: 0.9969295263290405, 
    portrait: 0.9949591159820557, 
    face: 0.9261120557785034 
} 

Проблема заключается в том, что мне нужно знать не только то, что на изображении, но и положение этого объекта. Некоторые из этих API имеют такую ​​функцию, но только для обнаружения лиц.

Значит, кто-нибудь знает, есть ли такой API, или мне нужно обучать собственные каскады хара на OpenCV для каждого объекта.

Я буду очень благодарен за обмен информацией.

ответ

0

Вы можете взглянуть на Wolfram Cloud/Mathematica.

Он имеет возможность определять местоположение объектов на картинке.

Некоторые примеры.

+1

Это кажется слишком сложным для меня. Кроме того, мне хотелось бы что-то с поддержкой Java, потому что мой проект находится на Java. Но спасибо в любом случае) –

+0

И Wolfram, и Mathematica поддерживают Java. –

+1

о, извините, не видел это. Я еще раз посмотрю на это. –

Смежные вопросы