Toshiba Corporation ha desenvolupat una IA amb reconeixement 3D que és capaç de mesurar la distància amb la precisió d’una càmera estèreo mitjançant l’ús de la imatge presa amb una càmera comercial i l’anàlisi de la difuminació de la imatge causada per l’objectiu de la càmera mitjançant un aprenentatge profund. Aquesta tecnologia eliminarà l'ús de càmeres estèreo que, finalment, reduirà el cost i l'espai. Toshiba presentarà aquest assoliment a la conferència internacional sobre visió per ordinador (ICCV2019) que se celebrarà a Corea del Sud el 30 d’octubre de 2019, a partir de les 10 del matí.
La detecció d’imatges és cada vegada més important i aplicacions com ara robots que mouen objectes, vehicles autònoms no tripulats, drons controlats a distància que inspeccionen infraestructures, etc., requereixen alguna cosa més que imatges dels subjectes, necessiten un petit dispositiu per analitzar dades 3D per incloure forma i distància. Per tant, s’han augmentat les investigacions per desenvolupar una tecnologia de mesura amb càmeres monoculars (són fàcils de miniaturitzar) mitjançant l’aprenentatge profund per a un millor aprenentatge de la forma, el fons i altres dades de paisatge de l’objecte amb imatges.
Aquest mètode té un inconvenient; la precisió de la distància s’estima amb l’ajuda d’una càmera monocular en funció de les dades de paisatges apreses, cosa que provoca una caiguda de precisió a causa de les preses realitzades en diferents paisatges. Per superar això, Toshiba ha desenvolupat una fotografia d'obertura filtrada en color en què s'adjunta un filtre de dos colors a l'objectiu i s'analitza el color i la mida del desenfocament de la imatge segons la distància del subjecte. Tot i que això resol el problema de dependència de dades, costa temps i diners modificar els objectius existents.
Toshiba ha superat aquest problema desenvolupant IA amb tecnologia de reconeixement 3D que utilitza un aprenentatge profund per analitzar com es difon la imatge segons la seva posició sobre l’objectiu, per tal d’aconseguir la mesura de distància amb la mateixa alta precisió que un sistema de càmeres estèreo., amb una càmera monocular normal, però sense necessitat de dades de paisatge. Fins ara, es considerava teòricament impossible mesurar la distància en funció de la forma del desenfocament, que és el mateix per als objectes amb distància i distància quan són equidistants del punt focal. Però, els resultats analítics han mostrat una diferència substancial entre les formes de desenfocament d’objectes propers i llunyans, fins i tot són equidistants del punt focal. Amb això, Toshiba va analitzar amb èxit les dades de desenfocament de les imatges capturades mitjançant un mòdul d'aprenentatge profund format amb el model de xarxa neuronal profunda.
Quan la llum travessa l’objectiu, se sap que la forma del desenfocament creat canvia en funció de la longitud d’ona de la llum i de la seva posició a l’objectiu. A la xarxa desenvolupada, la posició i el color es processen per separat per percebre correctament els canvis en la forma del desenfocament i, després de passar per un mecanisme d’atenció ponderada, per controlar on es centra el gradient de brillantor per mesurar correctament la distància. Mitjançant l’aprenentatge, la xarxa s’actualitza per reduir un error entre la distància mesurada i la distància real. Mitjançant aquest mòdul d’intel·ligència artificial, Toshiba ha confirmat que una sola imatge capturada amb una càmera disponible al mercat realitza la mateixa precisió de mesurament de distància assegurada amb les càmeres estèreo. Podeu trobar més informació en aquesta pàgina oficial de Toshiba.
Toshiba confirmarà la versatilitat del sistema amb càmeres i objectius disponibles al comerç i accelerarà el processament d’imatges, amb l’objectiu de la seva implementació pública l’any fiscal 2020.
