Как получить позицию пользовательского объекта на изображении с помощью распознавания зрения api

Я знаю, что существует много API распознавания зрения, таких как Clarifai, Watson, Google Cloud Vision, Microsoft Cognitive Services, которые обеспечивают распознавание содержимого изображения. Реакция этих услуг является простой JSON, который содержит различные теги, напримерКак получить позицию пользовательского объекта на изображении с помощью распознавания зрения api

{ 
    man: 0.9969295263290405, 
    portrait: 0.9949591159820557, 
    face: 0.9261120557785034 
}

Проблема заключается в том, что мне нужно знать не только то, что на изображении, но и положение этого объекта. Некоторые из этих API имеют такую функцию, но только для обнаружения лиц.

Значит, кто-нибудь знает, есть ли такой API, или мне нужно обучать собственные каскады хара на OpenCV для каждого объекта.

Я буду очень благодарен за обмен информацией.

источник

2016-07-28 I. Sokolyk

Вы можете взглянуть на Wolfram Cloud/Mathematica.

Он имеет возможность определять местоположение объектов на картинке.

Некоторые примеры.

источник

2016-07-28 21:45:49

Это кажется слишком сложным для меня. Кроме того, мне хотелось бы что-то с поддержкой Java, потому что мой проект находится на Java. Но спасибо в любом случае) –

И Wolfram, и Mathematica поддерживают Java. –

о, извините, не видел это. Я еще раз посмотрю на это. –

Как получить позицию пользовательского объекта на изображении с помощью распознавания зрения api

ответ

Смежные вопросы