Ang mga tradisyonal na 2D na camera ay nakikita lamang ang isang patag, dalawang dimensyonal na mundo. Nakikilala nila ang hugis at kulay ng mga bagay, ngunit hindi nila maunawaan ang kanilang posisyon, sukat, o distansya sa espasyo. Ito ay naglilimita sa mga kakayahan ng maraming advanced na robotics at automation na aplikasyon. Ang paglitaw ng mga camera na may kakayahang sumukat ng lalim ay nagbago nito. Binibigyan nila ang mga makina ng bagong kakayahang "tatlong dimensyonal" na panlasa, na nagpapahintulot sa mga sistema na maunawaan ang espasyo nang katulad ng pag-unawa ng tao, na bukas ang malawak na larangan ng aplikasyon para sa embedded vision at 3D perception na solusyon.
Bilang isang konsultant na espesyalista sa mga camera module, ang artikulong ito ay magbibigay ng malalim na pagsusuri sa teknolohiya ng mga camera na may kakayahang sumukat ng lalim, sa pangunahing mga uri nito, at sa mga aplikasyon nito sa robotics, logistics, at AR/VR. Pag-aaralan natin ang mga katangian ng bawat teknolohiya upang tulungan ang mga inhinyero na maunawaan kung paano gumagana ang mga camera na may kakayahang sumukat ng lalim at gawin ang pinakamabisang pagpili para sa kanilang mga proyekto.
Ang depth-sensing camera, na tinatawag ding madalas na 3D camera, ay isang camera na kayang kumuha ng impormasyon tungkol sa lalim para sa bawat pixel sa isang eksena. Hindi lamang ito naglalabas ng tradisyonal na RGB na imahe kundi pati na rin ng isang depth map o point cloud data. Ang bawat halaga ng pixel sa isang depth map ay kumakatawan sa distansya sa pagitan ng puntong iyon at ng camera.
kailangan ang mga 3D camera dahil hindi kayang resolbahin ng mga 2D na imahe ang pangunahing problema sa paningin: ang spatial ambiguity (pagkakalito sa espasyo). Hindi makikilala ng isang 2D camera ang pagkakaiba sa pagitan ng isang maliit na bagay na malapit at isang malaking bagay na malayo. Bukod dito, ang mga pagbabago sa ilaw, anino, at pagkakatago (occlusions) ay maaaring magdulot ng kabiguan sa mga 2D na sistema ng paningin. Halimbawa, maaaring kamalian ang isang bagay na nasa anino bilang ibang bagay o hindi ma-detect nang buo.

Ang mga camera na may kalaliman ay lubos na nakakasagot sa problemang ito sa pamamagitan ng pagbibigay ng tiyak na impormasyon tungkol sa distansya. Nagbibigay sila ng impormasyong heometrik sa mga makina na hindi naaapektuhan ng ilaw, kulay, at tekstura. Ang kakayahang pang-unawa sa 3D batay sa hugis na ito ay nagpapahintulot sa mga makina na unawain at makipag-ugnayan sa tunay na mundo, na nagsisilbing pundasyon para sa pagkamit ng mga solusyon sa panlasa na may kinalaman sa 3D na paningin na nakabase sa mga embedded system.
Sa lahat ng mga teknolohiyang pang-sensing ng kalaliman na available ngayon, ang tatlong pinakasikat at karaniwang ginagamit ay:
1. Estrukturang liwanag
2. Oras ng Paglipat (Time of Flight)
2.1 Direktang Oras ng Paglipat (dToF)
2.1.1 LiDAR
2.2 Hindi Direktang Oras ng Paglipat (iToF)
3. Stereo na Paningin
Susunod, tingnan natin nang mas malapit kung paano gumagana ang bawat isa sa mga teknolohiyang pang-sensing ng kalaliman na ito.
Upang maunawaan kung paano gumagana ang mga camera na may kakayahang sumukat ng kalaliman, mahalaga ang malalim na pag-unawa sa mga pangunahing uri ng teknolohiya ng camera na may kalaliman na nasa likod nila. Kasalukuyang may tatlong pangunahing teknolohiya ng camera na may kalaliman.
Ang kamera ng structured light ay isang teknolohiyang aktibong imaging. Gumagamit ito ng mataas na kapasidad na infrared projector upang i-project ang isang kilalang pattern ng liwanag, tulad ng isang tiyak na pattern na binubuo ng libu-libong tuldok, sa isang eksena. Pagkatapos ay gumagamit ito ng isang o higit pang mga kamera upang kuhanin ang distorsyon ng pattern na ito sa ibabaw ng isang bagay. Sa pamamagitan ng pagkalkula sa distorsyon na ito, ang kamera ay makakapaghula ng 3D na hugis at distansya ng bagay.
Ang teknolohiyang ito ay nagbibigay ng napakahusay na tumpak at mataas na resolusyon na data ng lalim, lalo na sa malapit na distansya. Ang kakayahang magmeasure nito sa submillimeter ay nakikilala sa mga aplikasyon na nangangailangan ng tiyak na pagsukat ng mga detalye ng bagay. Gayunpaman, maaaring apektuhan ng ambient light (lalo na ang matinding sikat ng araw) ang projected light, na nakakaapekto sa katumpakan ng pagsukat. Bukod dito, kapag ginamit ang maraming kamera ng structured light sa parehong lugar, maaaring mag-interfere ang kanilang mga projected pattern sa isa't isa.
Ang mga kamera ng Time-of-Flight, na batay sa prinsipyo ng pare-parehong bilis ng liwanag, ay nagpapalabas ng infrared na liwanag at sinusukat ang oras na kinakailangan upang bumalik ang pulso ng liwanag sa sensor ng kamera. Batay sa pagkakaiba ng oras na ito, maaaring tumpak na kalkulahin ang distansya sa pagitan ng bagay at ng kamera. Ang prosesong ito ay karaniwang isinasagawa nang sabay-sabay sa bawat pixel, na nagpapahintulot sa mataas na bilis ng frame sa pagkuha ng lalim.
Depende sa paraan na ginagamit upang matukoy ang distansya, ang ToF ay nahahati sa dalawang uri: direct time-of-flight (DToF) at indirect time-of-flight (iToF).
ang dToF ay direktang sumusukat sa oras ng paglipat ng isang pulso ng liwanag mula sa pagsisimula ng pagpapalabas hanggang sa pagbabalik. Gumagamit ito ng isang nakalaang sensor upang tumpak na tukuyin ang oras ng pagdating ng mga indibidwal na photon. Ang direktang paraan ng pagsukat na ito ay nagpapahintulot ng mas mahabang distansya ng pagsukat at mas mataas na katiyakan.
Ang LiDAR (laser radar) ay isang uri ng teknolohiyang dToF. Karaniwan itong gumagamit ng laser scanner upang magpadala ng liwanag na laser punto-punto sa isang eksena at tumanggap ng sumasalat na liwanag upang makabuo ng mataas na kahusayan na point cloud. Ang mahabang saklaw ng pagkakakita ng LiDAR at ang malakas nitong paglaban sa ambient light ay ginagawa itong ideal para sa awtonomong pagmamaneho at mataas na kahusayang pagmemapa para sa mga robot.
ang iToF ay hindi direktang sumusukat ng oras. Sa halip, nagpapadala ito ng patuloy na binabago na alon ng liwanag at sinusukat ang pagkakaiba ng phase sa pagitan ng sumasalat at ipinadadalang liwanag. Ang pagkakaiba ng phase na ito ay proporsyonal sa time of flight ng liwanag. Ang mga sistema ng iToF ay karaniwang mas kompakto, mas mababa ang konsumo ng kapangyarihan, at nakakamit ang mas mataas na frame rate. Ang mga ito ay angkop para sa maikling saklaw na indoor na aplikasyon tulad ng pagkilala sa galaw (gesture recognition) at pagpapatunay sa mukha (facial authentication).
Ang isang stereo vision camera ay tumutularan sa binocular na paningin ng tao. Ginagamit nito ang dalawang camera na nakainstal sa isang nakatakda at pare-parehong distansya upang sabay na kumuha ng parehong eksena. Sa pamamagitan ng mga kumplikadong algorithm, hinahanap ng sistema ang mga katumbas na punto sa dalawang imahe at, gamit ang mga prinsipyo ng triangulation, kinukwenta ang posisyon ng bawat punto sa tatluhang dimensyonal na espasyo, na nagbubuo ng isang disparity map.
Ang pasibong teknolohiyang ito ay hindi nangangailangan ng karagdagang pinagmumulan ng liwanag, kaya ito ay angkop para sa paggamit sa labas at sa mga kapaligiran na may sapat na likas na liwanag. Nagbibigay ito ng mga depth map na mataas ang resolusyon at hindi naaapektuhan ng materyal ng bagay. Gayunpaman, ang stereo vision ay lubos na nangangailangan ng proseso ng komputasyon at nangangailangan ng isang napakalakas na processor upang maisagawa ang image matching. Nakakaranas din ito ng problema sa mga walang texture na lugar (tulad ng puting pader o mga ibabaw na may solong kulay) dahil hindi makakahanap ng mga katumbas na punto ang algorithm.
| Mga ari-arian | STRUCTURED LIGHT | STEREO VISION | Lidar | dToF | iToF |
| PAMILYA | Distorsyon ng inilapat na pattern | Paghahambing ng imahe ng dual camera | Oras ng paglisan ng natugtugong liwanag | Oras ng paglisan ng natugtugong liwanag | Pagbabago ng fase ng impulso ng liwanag na inimodulate |
| Kumplikadong Software | Mataas | Mataas | Mababa | Mababa | Katamtaman |
| Gastos | Mataas | Mababa | Baryable | Mababa | Katamtaman |
| Katumpakan | Antas ng mikrometro | Antas ng sentimitro | Depende sa sakop | Milyimeter hanggang sentimitro | Milyimeter hanggang sentimitro |
| Operating Range | Maikli | ~6 metro | Maaaring ma-scale up o down | Masusukat | Masusukat |
| Pagganap sa mababang liwanag | Mabuti | Mahina | Mabuti | Mabuti | Mabuti |
| Kabisaang Pagganap | Mahina | Mabuti | Mabuti | Moderado | Moderado |
| Bilis ng pagsusuri | Mabagal | Katamtaman | Mabagal | Mabilis | Sobrang Bilis |
| Pagiging kumpakt | Katamtaman | Mababa | Mababa | Mataas | Katamtaman |
| Konsumo ng Kuryente | Mataas | Mababa hanggang ma-scale | Taas hanggang ma-scale | Katamtaman | Maay-ayos hanggang katamtaman |
ang teknolohiyang 3D camera ay umalis na sa laboratorio patungo sa komersyal na paggamit, at ang kanyang iba't ibang kakayahan ay nagpapalit ng mga industriya sa iba't ibang larangan.
Ang mga depth camera para sa robotics ay gumagana bilang mga "organong pang-unawa sa espasyo" ng mga robot. Sa mga awtomatikong linya ng produksyon, kailangan ng mga robot na tumpak na kilalanin at hawakan ang mga piraso ng gawaing nakatambak nang random. Ang mga 3D camera ay maaaring magbuo ng napakahusay na point cloud data, na tumutulong sa mga robot na maunawaan ang tatlong dimensyonal na pose at posisyon ng mga bagay, na nagpapahintulot sa tumpak na paghawak, pag-uuri, at pag-aayos—na nagpapataas nang malaki ng kahusayan at fleksibilidad ng produksyon.
Ang mga device na AR/VR ay nangangailangan ng real-time na kamalayan sa kapaligiran upang maisama nang maayos ang mga virtual na bagay sa tunay na mundo. Ang mga depth camera ay maaaring magpatupad ng tatlong-dimensyonal na pag-scan sa kuwarto ng gumagamit at lumikha ng isang tumpak na depth map. Ito ay nagpapahintulot sa mga virtual na bagay na ilagay nang tumpak sa ibabaw ng isang mesa o itago sa likod ng mga tunay na bagay, na lubos na nagpapahusay sa immersive at interactive na karanasan ng gumagamit.
Ang awtomatikong pag-iimbak, pagsukat ng bolyum ng pakete, at pagpapaloob ay mga pangunahing kinakailangan sa industriya ng logistics. Ang mga 3D na kamera ay maaaring mabilis na sukatin ang bolyum at timbang ng mga pakete upang mapabuti ang pagkarga sa truck. Sa mga awtomatikong garahe, maaari nilang gabayan ang mga robot upang eksaktong kunin at ilagay ang mga item mula sa mga shelf at isagawa ang pagbilang ng imbentaryo, na nagpapahintulot sa epektibong pamamahala ng garahe.
Sa larangan ng pangangalagang pangkalusugan, ang mga 3D na kamera ay maaaring gamitin para sa contactless na pagsukat ng katawan, pagsusuri ng istilo ng pagtayo, at pagpaplano ng operasyon. Sa pamamagitan ng 3D scanning, ang mga depth camera ay maaaring lumikha ng mga modelo ng tao para sa mga prosthetics at orthotics na nakabase sa indibidwal na pangangailangan. Sa biometrics, maaari nilang kilalanin ang natatanging heometriya ng mukha upang magbigay ng mas ligtas na pagpapatunay at maiwasan ang pagkopya o paggamit ng litrato o video bilang pandaraya.
Ang mga kamera na may kakayahang makadama ng lalim ay kumakatawan sa isang malaking teknolohikal na unlad sa larangan ng embedded vision. Kung ito man ay structured light, time-of-flight, o binocular vision, bawat teknolohiya ay nag-aalok ng natatanging solusyon para sa 3D perception. Ang pag-unawa sa mga prinsipyo at katangian ng mga uri ng depth camera na ito, at ang tamang pagpili ng mga ito batay sa sitwasyon ng aplikasyon (halimbawa, mga depth camera para sa robotics), ay mahalaga para sa bawat inhinyero ng machine vision. Ang mga depth camera ay nagbibigay-kapangyarihan sa mga makina ng kakayahang percebihin ang tatlong-dimensyonal na mundo at nagpapadala ng malalim na pagbabago mula sa awtomasyon patungo sa katalinuhan.
Nakakaramdam ka ba ng kahirapan sa pagpili ng tamang depth camera para sa iyong proyekto? Makipag-ugnayan sa aming koponan ng mga eksperto ngayon para sa propesyonal na konsultasyon sa embedded vision at 3D perception solution, na tumutulong sa iyo na magtayo ng pinakamahusay na sistema ng machine vision para sa iyong aplikasyon.