Kamera 2D tradisional hanya mampu melihat dunia rata dua dimensi. Kamera ini boleh mengenali bentuk dan warna objek, tetapi tidak dapat memahami kedudukan, saiz, atau jarak objek dalam ruang. Kelemahan ini menghadkan keupayaan banyak aplikasi robotik dan automasi canggih. Kehadiran kamera pengesan kedalaman telah mengubah keadaan ini. Kamera ini memberikan jentera suatu kemampuan persepsi "tiga dimensi" baharu, membolehkan sistem memahami ruang secara serupa dengan manusia, serta membuka ruang aplikasi yang luas bagi penyelesaian penglihatan terbenam dan persepsi 3D.
Sebagai seorang perunding pakar dalam modul kamera, artikel ini akan memberikan analisis mendalam mengenai teknologi kamera pengesan kedalaman, jenis-jenis utamanya, serta aplikasinya dalam robotik, logistik, dan AR/VR. Kami akan meneroka ciri-ciri setiap teknologi untuk membantu jurutera memahami cara kamera pengesan kedalaman beroperasi dan membuat pilihan paling tepat bagi projek mereka.
Kamera pengesan kedalaman, yang juga sering dirujuk sebagai kamera 3D, ialah kamera yang mampu menangkap maklumat kedalaman bagi setiap piksel dalam suatu pemandangan. Ia menghasilkan bukan sahaja imej RGB tradisional tetapi juga peta kedalaman atau data awan titik. Nilai setiap piksel dalam peta kedalaman mewakili jarak antara titik tersebut dan kamera.
kamera 3D diperlukan kerana imej 2D tidak dapat menyelesaikan satu masalah utama dalam penglihatan: ketidakjelasan ruang. Kamera 2D tidak mampu membezakan antara objek kecil yang berada dekat dan objek besar yang berada jauh. Selain itu, variasi pencahayaan, bayang-bayang, dan halangan boleh menyebabkan sistem penglihatan 2D gagal. Sebagai contoh, suatu objek dalam bayang-bayang mungkin disalah anggap sebagai objek lain atau malah tidak dikesan langsung.

Kamera kedalaman menyelesaikan masalah ini dengan sempurna dengan menyediakan maklumat jarak yang tepat. Kamera ini memberikan maklumat geometri kepada mesin yang tidak terjejas oleh pencahayaan, warna, dan tekstur. Keupayaan persepsi berdasarkan bentuk 3D ini membolehkan mesin memahami dan berinteraksi dengan dunia sebenar, menjadi asas bagi pelaksanaan penyelesaian persepsi penglihatan tertanam 3D.
Daripada semua teknologi pengesan kedalaman yang tersedia hari ini, tiga teknologi yang paling popular dan biasa digunakan ialah:
1. Cahaya struktur
2. Masa Laluan (Time of Flight)
2.1 Masa Laluan Langsung (dToF)
2.1.1 LiDAR
2.2 Masa Laluan Tidak Langsung (iToF)
3. Penglihatan Stereo
Seterusnya, mari kita lihat lebih dekat cara setiap teknologi pengesan kedalaman ini beroperasi.
Untuk memahami cara kamera pengesan kedalaman beroperasi, penting untuk mempunyai pemahaman mendalam tentang jenis-jenis utama teknologi kamera kedalaman yang mendasarinya. Pada masa ini, terdapat tiga teknologi kamera kedalaman utama yang dominan.
Kamera cahaya terstruktur ialah teknologi pengimejan aktif. Ia menggunakan projektor inframerah berkuasa tinggi untuk memproyeksikan corak cahaya yang diketahui, seperti corak khusus yang terdiri daripada ribuan titik, ke atas suatu adegan. Seterusnya, ia menggunakan satu atau lebih kamera untuk menangkap distorsi corak ini pada permukaan suatu objek. Dengan mengira distorsi ini, kamera dapat menyimpulkan bentuk tiga dimensi dan jarak objek tersebut.
Teknologi ini memberikan data kedalaman yang sangat tepat dan beresolusi tinggi, terutamanya pada jarak dekat. Keupayaan pengukurannya yang berada di bawah milimeter unggul dalam aplikasi yang memerlukan pengukuran terperinci objek secara tepat. Namun, cahaya yang diproyeksikan boleh terganggu oleh cahaya persekitaran (terutamanya sinaran matahari yang kuat), yang seterusnya menjejaskan ketepatan pengukuran. Selain itu, apabila beberapa kamera cahaya terstruktur digunakan dalam ruang yang sama, corak projeksi mereka boleh saling mengganggu.
Kamera Masa-Perjalanan (Time-of-Flight), yang berdasarkan prinsip kelajuan cahaya yang malar, memancarkan cahaya inframerah dan mengukur masa yang diambil oleh denyut cahaya tersebut untuk memantul kembali ke sensor kamera. Berdasarkan perbezaan masa ini, jarak antara objek dan kamera dapat dikira dengan tepat. Proses ini biasanya dilakukan secara selari pada setiap piksel, membolehkan pengambilan kedalaman pada kadar bingkai tinggi.
Bergantung kepada kaedah yang digunakan untuk menentukan jarak, Masa-Perjalanan (ToF) dikategorikan kepada dua jenis: Masa-Perjalanan Langsung (Direct Time-of-Flight, DToF) dan Masa-Perjalanan Tidak Langsung (Indirect Time-of-Flight, iToF).
dToF mengukur secara langsung masa perjalanan denyut cahaya dari pancaran hingga kembali. Ia menggunakan sensor khas untuk mengesan dengan tepat masa ketibaan foton individu. Kaedah pengukuran langsung ini membolehkan jarak pengukuran yang lebih jauh dan ketepatan yang lebih tinggi.
LiDAR (radar laser) ialah sejenis teknologi dToF. Ia biasanya menggunakan pengimbas laser untuk memancarkan cahaya laser titik demi titik dalam suatu adegan dan menerima cahaya pantulan bagi menjana awan titik berketepatan tinggi. Julat pengesanan yang panjang dan rintangan kuat terhadap cahaya persekitaran menjadikan LiDAR ideal untuk pemanduan autonomi dan pemetaan berketepatan tinggi bagi robot.
iToF tidak mengukur masa secara langsung. Sebaliknya, ia memancarkan gelombang cahaya bermodulasi secara berterusan dan mengukur perbezaan fasa antara cahaya yang dipantulkan dan cahaya yang dipancarkan. Perbezaan fasa ini berkadar dengan masa terbang cahaya. Sistem iToF umumnya lebih padat, menggunakan kurang tenaga, dan mencapai kadar bingkai yang lebih tinggi. Ia sesuai untuk aplikasi dalaman jarak pendek seperti pengenalan isyarat tangan dan pengesahan wajah.
Kamera penglihatan stereo meniru penglihatan binokular manusia. Ia menggunakan dua kamera yang dipasang pada jarak dasar tetap untuk menangkap pemandangan yang sama secara serentak. Dengan menggunakan algoritma kompleks, sistem ini mengenal pasti titik-titik sepadan dalam dua imej tersebut dan, berdasarkan prinsip triangulasi, mengira kedudukan setiap titik dalam ruang tiga dimensi, menghasilkan peta perbezaan.
Teknologi pasif ini tidak memerlukan sumber cahaya tambahan, menjadikannya sesuai untuk penggunaan di luar bangunan dan persekitaran dengan cahaya semula jadi yang mencukupi. Ia memberikan peta kedalaman beresolusi tinggi yang tidak terjejas oleh bahan objek. Namun, penglihatan stereo memerlukan banyak tenaga pengiraan dan memerlukan pemproses yang kuat untuk menjalankan pencocokan imej. Ia juga menghadapi kesukaran di kawasan tanpa tekstur (seperti dinding putih atau permukaan berwarna padu) kerana algoritma tidak dapat mengenal pasti titik-titik sepadan.
| Harta | CAHAYA TERSTRUKTUR | PENGLIHATAN STEREO | LiDAR | dToF | iToF |
| PRINSIP | Kekacauan pola diproyeksikan | Perbandingan imej kamera ganda | Masa terbang cahaya pantulan | Masa terbang cahaya pantulan | Kesesuaian fasa impul cahaya termodulasikan |
| Kompleksiti Perisian | Tinggi | Tinggi | Rendah | Rendah | Sederhana |
| Kos | Tinggi | Rendah | Pemboleh ubah | Rendah | Sederhana |
| Ketepatan | Tingkat mikrometer | Tingkat sentimeter | Bergantung julat | Milimeter hingga sentimeter | Milimeter hingga sentimeter |
| Julat operasi | Pendek | ~6 meter | Sangat fleksibel | Boleh skala | Boleh skala |
| Prestasi cahaya rendah | Baik | Lemah | Baik | Baik | Baik |
| Prestasi Luar | Lemah | Baik | Baik | Sederhana | Sederhana |
| Kelajuan pindaian | Lambat | Sederhana | Lambat | Pantas | Sangat Cepat |
| Ketumpatan | Sederhana | Rendah | Rendah | Tinggi | Sederhana |
| Kehabisan kuasa | Tinggi | Rendah hingga boleh diskala | Tinggi hingga boleh diskala | Sederhana | Dapat diperluas kepada sederhana |
teknologi kamera 3D telah berpindah dari makmal ke penggunaan komersial, dan pelbagai kemampuannya sedang merevolusikan pelbagai industri.
Kamera kedalaman untuk robotik berfungsi sebagai "organ persepsi ruang" bagi robot. Dalam talian pengeluaran automatik, robot mesti mengenal pasti dan memegang komponen kerja yang ditumpuk secara rawak dengan tepat. Kamera 3D boleh menjana data titik awan yang sangat tepat, membantu robot memahami posisi dan orientasi tiga dimensi objek, membolehkan pegangan, pengisihan, dan pemasangan yang tepat, serta meningkatkan ketara kecekapan dan kelenturan pengeluaran.
Peranti AR/VR memerlukan kesedaran persekitaran secara masa nyata untuk mengintegrasikan objek maya ke dalam dunia sebenar dengan lancar. Kamera kedalaman boleh melakukan imbasan tiga dimensi bilik pengguna dan menjana peta kedalaman yang tepat. Ini membolehkan objek maya diletakkan secara tepat di atas meja atau disembunyikan di belakang objek sebenar, secara ketara meningkatkan pengalaman pengguna yang mendalam dan interaktif.
Gudang automatik, pengukuran isi padu bungkusan, dan pengepalaan palet merupakan keperluan utama dalam industri logistik. Kamera 3D boleh dengan cepat mengukur isi padu dan berat bungkusan untuk mengoptimumkan pemuatan lori. Dalam gudang automatik, kamera ini boleh membimbing robot untuk memilih dan meletakkan barang secara tepat dari rak serta menjalankan kiraan inventori, membolehkan pengurusan gudang yang cekap.
Dalam bidang penjagaan kesihatan, kamera 3D boleh digunakan untuk pengukuran badan tanpa sentuhan, analisis postur, dan perancangan pembedahan. Melalui pengimbasan 3D, kamera kedalaman boleh menjana model manusia bagi prostetik dan ortotik yang disesuaikan. Dalam biometrik, kamera ini boleh mengenal pasti geometri wajah unik untuk menyediakan proses pengesahan identiti yang lebih selamat serta mencegah penipuan melalui foto atau video.
Kamera pengesan kedalaman mewakili kemajuan teknologi yang signifikan dalam bidang penglihatan terbenam. Sama ada cahaya berstruktur, masa perjalanan, atau penglihatan binokular, setiap teknologi menawarkan penyelesaian unik untuk persepsi 3D. Memahami prinsip dan ciri-ciri jenis kamera kedalaman ini serta memilihnya secara tepat berdasarkan senario aplikasi (seperti kamera kedalaman untuk robotik) adalah penting bagi setiap jurutera penglihatan mesin. Kamera kedalaman memberdayakan mesin dengan keupayaan untuk mengesan dunia tiga dimensi dan sedang mendorong transformasi mendalam dari automasi kepada kecerdasan.
Adakah anda menghadapi kesukaran untuk memilih kamera kedalaman yang sesuai untuk projek anda? Hubungi pasukan pakar kami hari ini untuk mendapatkan khidmat nasihat profesional dalam bidang penglihatan terbenam dan penyelesaian persepsi 3D, membantu anda membina sistem penglihatan mesin terbaik untuk aplikasi anda.