Identificazione di oggetti in immagini con Convolutional Neural Network, Python e MXNet

August, 2016


Ci sono molti strumenti che permettono di identificare un oggetto in un’immagine, come ad esempio il modello bag of visual words, tramite i descrittori di feature SIFT (scale-invariant feature transform) o SURF (speeded up robust feature), oppure l’utilizzo delle macchine a vettori di supporto (SVM, support vector machine); tuttavia, in questi ultimi anni, le reti neurali profonde (DNN, deep neural networks) hanno contribuito con un nuovo impulso alla ricerca e sono, pertanto, sempre più utilizzate. Infatti, l’abilità delle DNN nell’apprendere, a partire da grandi insiemi di esempi, funzioni complesse, non-lineari e ad alta dimensionalità, le rende perfette candidate per i compiti di riconoscimento di immagini. Un tipo particolare di DNN sono le reti neurali convoluzionali (CNN, convolutional neural networks) usate con grande successo per problemi di riconoscimento automatico di pattern bidimensionali come la rivelazione di oggetti, facce e loghi nelle immagini. In questo post introduco alcune specifiche implementazioni di CNN in grado di offrire un’elaborazione cognitiva delle immagini che è molto prossima allo stato dell’arte. Il codice esemplificativo è basato sull’impiego del framework MXNet in combinazione con il linguaggio Python.

Continua a leggere l’articolo originale Identificazione di oggetti in immagini con Convolutional Neural Network, Python e MXNet sul mio vecchio blog.

Identificazione di oggetti in immagini con Convolutional Neural Network, Python e MXNet - August 7, 2016 - lorenzo toscano
To Top