Toshiba Corporation ha sviluppato un'intelligenza artificiale con riconoscimento 3D in grado di misurare la distanza con la precisione di una fotocamera stereo, utilizzando l'immagine scattata con una fotocamera commerciale e analizzando la sfocatura dell'immagine causata dall'obiettivo della fotocamera utilizzando il deep learning. Questa tecnologia eliminerà l'uso di telecamere stereo che alla fine riduce i costi e lo spazio. Toshiba presenterà questo risultato alla conferenza internazionale sulla visione artificiale (ICCV2019) che si terrà in Corea del Sud il 30 ottobre 2019, dalle 10:00.
Il rilevamento delle immagini sta diventando sempre più importante e applicazioni come robot che muovono oggetti, veicoli autonomi senza pilota, droni telecomandati che ispezionano l'infrastruttura ecc., Richiedono più delle semplici immagini dei soggetti, hanno bisogno di un piccolo dispositivo per analizzare i dati 3D per includere forma e distanza. Quindi le ricerche sono state aumentate per sviluppare una tecnologia di misurazione con telecamere monoculari (sono facili da miniaturizzare) utilizzando l'apprendimento profondo per un migliore apprendimento della forma, dello sfondo e di altri dati di scenario dell'oggetto ripreso.
Questo metodo presenta uno svantaggio; la precisione della distanza viene stimata con l'aiuto di una telecamera monoculare in base ai dati di paesaggio appresi che provoca un calo di precisione a causa delle riprese effettuate in diversi paesaggi. Per ovviare a questo problema, Toshiba ha sviluppato una fotografia con apertura filtrata a colori in cui due filtri di colore sono attaccati all'obiettivo e il colore e le dimensioni della sfocatura dell'immagine risultante vengono analizzati in base alla distanza dal soggetto. Sebbene questo risolva il problema della dipendenza dai dati, la modifica degli obiettivi esistenti richiede tempo e denaro.
Toshiba ha superato questo problema sviluppando un'intelligenza artificiale con tecnologia di riconoscimento 3D che utilizza il deep learning per analizzare come l'immagine è sfocata in base alla sua posizione sull'obiettivo, al fine di ottenere la misurazione della distanza con la stessa alta precisione di un sistema di telecamere stereo, con una normale telecamera monoculare ma senza bisogno di dati di scenario. Fino ad ora, era considerato teoricamente impossibile misurare la distanza in base alla forma della sfocatura, che è la stessa per gli oggetti sia distanti che lontani quando sono equidistanti dal punto focale. Ma i risultati analitici hanno mostrato una differenza sostanziale tra le forme sfocate degli oggetti vicini e lontani, anche se sono equidistanti dal punto focale. Con ciò Toshiba ha analizzato con successo i dati di sfocatura dalle immagini acquisite da un modulo di apprendimento profondo addestrato con il modello di rete neurale profonda.
Quando la luce passa attraverso l'obiettivo, è noto che la forma della sfocatura creata cambia a seconda della lunghezza d'onda della luce e della sua posizione nell'obiettivo. Nella rete sviluppata, la posizione e il colore vengono elaborati separatamente per percepire correttamente i cambiamenti nella forma della sfocatura e quindi, dopo essere passati attraverso un meccanismo di attenzione ponderata, per controllare dove concentrarsi sul gradiente di luminosità per misurare correttamente la distanza. Attraverso l'apprendimento, la rete viene quindi aggiornata per ridurre un errore tra la distanza misurata e la distanza effettiva. Utilizzando questo modulo AI, Toshiba ha confermato che una singola immagine acquisita con una fotocamera disponibile in commercio realizza la stessa precisione di misurazione della distanza garantita dalle telecamere stereo. Ulteriori informazioni possono essere trovate su questa pagina ufficiale di Toshiba.
Toshiba confermerà la versatilità del sistema con le fotocamere e gli obiettivi disponibili in commercio e accelererà l'elaborazione delle immagini, puntando all'implementazione pubblica nell'anno fiscale 2020.