„Toshiba Corporation“ sukūrė dirbtinį intelektą su 3D atpažinimu, kuris sugeba matuoti atstumą stereofoninės kameros tikslumu, naudodamas komercine kamera padarytą vaizdą ir giliai mokydamasis analizuodamas vaizdo neryškumą, kurį sukelia fotoaparato objektyvas. Ši technologija pašalins stereokamerų naudojimą, o tai ilgainiui sumažins išlaidas ir erdvę. „Toshiba“ pristatys šį laimėjimą tarptautinėje konferencijoje kompiuterinės regos tema (ICCV2019), kuri vyks Pietų Korėjoje 2019 m. Spalio 30 d., Nuo 10 val.
Vaizdo jutimas tampa vis svarbesnis, o tokioms programoms kaip objektus judantys robotai, autonominės nepilotuojamos transporto priemonės, nuotoliniu būdu valdomi bepiločiai orlaiviai, tikrinantys infrastruktūrą ir kt., Reikia ne tik objektų vaizdų, bet ir mažo prietaiso, kad būtų galima analizuoti 3D duomenis, įskaitant formą ir atstumą. Taigi tyrimai buvo išplėsti siekiant sukurti matavimo technologiją su monokulinėmis kameromis (jas lengva miniatiūrizuoti), naudojant gilųjį mokymąsi, kad geriau sužinotumėte apie vaizduojamo objekto formą, foną ir kitus dekoratyvinius duomenis.
Šis metodas turi trūkumų; atstumo tikslumas įvertinamas monokulinės kameros pagalba, atsižvelgiant į išmoktus gamtovaizdžio duomenis, dėl kurių skirtinguose peizažuose darytų kadrų sumažėja tikslumas. Norėdami tai įveikti, „Toshiba“ sukūrė spalvų filtruotą diafragmos fotografiją, kurioje prie objektyvo pritvirtintas dviejų spalvų filtras, o gauto vaizdo neryškumo spalva ir dydis analizuojami atsižvelgiant į atstumą nuo objekto. Nors tai išsprendžia priklausomybės nuo duomenų problemą, modifikuoti esamus objektyvus kainuoja daug laiko ir pinigų.
„Toshiba“ įveikė šią problemą sukurdama dirbtinį intelektą su 3D atpažinimo technologija, kuri giliai mokosi analizuoti, kaip vaizdas yra neryškus atsižvelgiant į jo padėtį objektyve, kad atstumas būtų matuojamas taip pat tiksliai, kaip ir stereo kamerų sistema., su įprasta monokuliarine kamera, bet nereikia dekoracijos duomenų. Iki šiol buvo laikoma, kad teoriškai neįmanoma išmatuoti atstumo pagal neryškumo formą, kuri yra vienoda objektams, turintiems atstumą ir tolį, kai jie yra vienodai nutolę nuo židinio taško. Analizės rezultatai parodė didelį skirtumą tarp neryškių formų, esančių šalia ir toli, net jei jie yra vienodai nutolę nuo židinio taško. Tuo Toshiba sėkmingai išanalizavo užfiksuotų vaizdų neryškius duomenis naudodamasis gilaus mokymosi moduliu, mokomu pagal giliųjų neuronų tinklo modelį.
Kai šviesa praeina pro lęšį, žinoma, kad sukurto neryškumo forma kinta priklausomai nuo šviesos bangos ilgio ir jos padėties lęšyje. Sukurtame tinkle padėtis ir spalva yra apdorojami atskirai, kad tinkamai suvoktų neryškios formos pokyčius, o po to, kai praeina per svertinį dėmesio mechanizmą, kontroliuojama, kur ryškumo gradiente reikia sutelkti dėmesį, norint teisingai išmatuoti atstumą. Mokantis, tinklas yra atnaujinamas, kad būtų sumažinta paklaida tarp išmatuoto ir faktinio atstumo. Naudodama šį dirbtinio intelekto modulį, „Toshiba“ patvirtino, kad vienas prekyboje esančia kamera užfiksuotas vaizdas realizuoja tą patį atstumo matavimo tikslumą, kuris užtikrinamas stereofoninėmis kameromis. Daugiau informacijos galite rasti šiame oficialiame „Toshiba“ puslapyje.
„Toshiba“ patvirtins sistemos universalumą naudodama komercinius fotoaparatus ir objektyvus bei paspartins vaizdo apdorojimą, siekdama, kad visuomenė jį įgyvendintų 2020 finansiniais metais.