Tradycyjne 2D kamery widzą jedynie płaski, dwuwymiarowy świat. Mogą rozpoznawać kształt i kolor obiektów, ale nie potrafią określić ich położenia, wielkości ani odległości w przestrzeni. Ogranicza to możliwości wielu zaawansowanych zastosowań robotyki i automatyzacji. Pojawienie się kamer wykrywających głębokość zmieniło tę sytuację. Nadają one maszynom nową zdolność „trójwymiarowego” postrzegania, umożliwiając systemom zrozumienie przestrzeni w sposób podobny do ludzkiego i otwierając ogromne możliwości zastosowania rozwiązań w zakresie wbudowanego widzenia i percepcji 3D.
Jako doradca specjalizujący się w modułach kamerowych w niniejszym artykule przedstawimy dogłębną analizę technologii kamer wykrywających głębokość, jej głównych rodzajów oraz zastosowań w robotyce, logistyce i rzeczywistości rozszerzonej/wirtualnej (AR/VR). Omówimy cechy każdej z tych technologii, aby pomóc inżynierom zrozumieć zasadę działania kamer wykrywających głębokość oraz dokonać najbardziej uzasadzonego wyboru dla swoich projektów.
Kamera wykrywająca głębokość, często nazywana również kamerą 3D, to urządzenie pozwalające na przechwytywanie informacji o głębokości dla każdego piksela w scenie. Generuje nie tylko tradycyjny obraz w kolorach RGB, ale także mapę głębokości lub dane chmury punktów. Każda wartość piksela na mapie głębokości reprezentuje odległość między tym punktem a kamerą.
kamery 3D są niezbędne, ponieważ obrazy 2D nie potrafią rozwiązać podstawowego problemu wizji: dwuznaczności przestrzennej. Kamera 2D nie potrafi odróżnić małego obiektu znajdującego się blisko od dużego obiektu położonego daleko. Ponadto zmiany oświetlenia, cienie oraz zakłócenia (np. zasłonięcia) mogą powodować awarie systemów wizji 2D. Na przykład obiekt znajdujący się w cieniu może zostać błędnie zidentyfikowany jako inny obiekt lub w ogóle nie zostać wykryty.

Kamery głębokości idealnie rozwiązują ten problem, dostarczając precyzyjnych informacji o odległości. Zapewniają one maszynom dane geometryczne, które nie są zakłócone przez oświetlenie, kolor i teksturę. Ta zdolność postrzegania oparta na trójwymiarowej formie umożliwia maszynom zrozumienie rzeczywistego świata i interakcję z nim, tworząc podstawę do wdrożenia rozwiązań percepcji 3D w systemach wizyjnych wbudowanych.
Spośród wszystkich dostępnych obecnie technologii pomiaru głębokości trzy są najpopularniejsze i najczęściej stosowane:
1. Strukturalne światło
2. Czas przelotu (Time of Flight)
2.1 Bezpośredni czas przelotu (dToF)
2.1.1 LiDAR
2.2 Pośredni czas przelotu (iToF)
3. Wizja stereoskopowa
Następnie przyjrzymy się bliżej zasadzie działania każdej z tych technologii pomiaru głębokości.
Aby zrozumieć, jak działają kamery pomiaru głębokości, konieczna jest dogłębna znajomość podstawowych typów technologii wykorzystywanych w takich kamerach. Obecnie istnieją trzy główne technologie stosowane w kamerach głębokości.
Kamera światła strukturalnego to technologia aktywnego obrazowania. Wykorzystuje wysokomocny podczerwony projektarz do rzutowania znanego wzoru świateł, np. konkretnego wzoru składającego się z tysięcy punktów, na scenę. Następnie wykorzystuje jedną lub więcej kamer do przechwytywania zniekształcenia tego wzoru na powierzchni obiektu. Obliczając to zniekształcenie, kamera może wywnioskować trójwymiarowy kształt i odległość obiektu.
Ta technologia zapewnia bardzo dokładne i wysokiej rozdzielczości dane głębokości, szczególnie w małych odległościach. Jej zdolność pomiaru z dokładnością submilimetrową sprawdza się w zastosowaniach wymagających precyzyjnego pomiaru szczegółów obiektów. Jednak rzutowane światło może być zakłócane światłem otoczenia (szczególnie silnym światłem słonecznym), co wpływa na dokładność pomiarów. Ponadto, gdy wiele kamer światła strukturalnego jest używanych w tej samej przestrzeni, ich wzory rzutowane mogą zakłócać się wzajemnie.
Kamery oparte na pomiarze czasu przelotu (Time-of-Flight), wykorzystujące stałą prędkość światła, emitują podczerwone światło i mierzą czas, jaki upływa od chwili emisji impulsu świetlnego do chwili jego odbicia i powrotu do czujnika kamery. Na podstawie tej różnicy czasowej można dokładnie obliczyć odległość pomiędzy obiektem a kamerą. Proces ten jest zazwyczaj wykonywany równolegle dla każdego piksela, umożliwiając przechwytywanie danych głębokości z wysoką częstotliwością klatek.
W zależności od metody wykorzystywanej do określenia odległości, pomiary czasu przelotu (ToF) dzieli się na dwa typy: bezpośredni pomiar czasu przelotu (DToF) oraz pośredni pomiar czasu przelotu (iToF).
dToF dokonuje bezpośredniego pomiaru czasu przelotu impulsu świetlnego – od chwili jego emisji do chwili powrotu. Do precyzyjnego wykrywania momentu przybycia pojedynczych fotonów stosuje się dedykowany czujnik. Ta metoda bezpośredniego pomiaru umożliwia uzyskanie większych zakresów pomiarowych oraz wyższą dokładność.
LiDAR (radar laserowy) to rodzaj technologii dToF. Zazwyczaj wykorzystuje skaner laserowy do emitowania światła laserowego punkt po punkcie w danej scenie oraz odbierania światła odbitego w celu wygenerowania chmury punktów o wysokiej precyzji. Duży zasięg wykrywania oraz duża odporność na światło otoczenia czynią LiDAR idealnym rozwiązaniem do systemów jazdy autonomicznej oraz do tworzenia map o wysokiej precyzji dla robotów.
iToF nie mierzy czasu bezpośrednio. Zamiast tego przesyła ciągłą, modulowaną falę świetlną i mierzy różnicę faz między światłem odbitym a światłem emitowanym. Różnica faz jest proporcjonalna do czasu przelotu światła. Systemy iToF są zazwyczaj bardziej zwarte, zużywają mniej energii i osiągają wyższe częstotliwości klatek. Są one odpowiednie do krótkozasięgowych zastosowań wewnątrz pomieszczeń, takich jak rozpoznawanie gestów czy uwierzytelnianie na podstawie twarzy.
Kamera stereowzroku naśladuje ludzki wzrok binokularny. Wykorzystuje dwie kamery umieszczone w stałej odległości od siebie (tzw. baza), które jednoczesnie nagrywają ten sam obraz. Za pomocą złożonych algorytmów system znajduje odpowiadające sobie punkty na obu obrazach i, korzystając z zasad triangulacji, oblicza położenie każdego punktu w przestrzeni trójwymiarowej, generując mapę dysparancji.
Ta technologia pasywna nie wymaga dodatkowego źródła światła, co czyni ją odpowiednią do zastosowania na zewnątrz oraz w środowiskach o obfitym świetle naturalnym. Zapewnia mapy głębokości o wysokiej rozdzielczości, które nie zależą od materiału obiektu. Jednak stereowzrok jest intensywny pod względem obliczeniowym i wymaga mocnego procesora do wykonywania dopasowania obrazów. Napotyka również trudności w obszarach bez tekstury (np. białe ściany lub powierzchnie jednolitego koloru), ponieważ algorytm nie może znaleźć odpowiadających sobie punktów.
| Nieruchomości | ŚWIATŁOŚĆ STRUKTUROWANA | WIDOWANIE STEREO | LiDAR | dToF | iToF |
| ZASADA | Distorsja wzoru rzutowanego | Porównanie obrazów z dwómii aparatów | Czas lotu odbitego światła | Czas lotu odbitego światła | Przesunięcie fazy zmodulowanego impulsu światła |
| Złożoność oprogramowania | Wysoki | Wysoki | Niski | Niski | Średni |
| Koszt | Wysoki | Niski | Zmienna | Niski | Średni |
| Dokładność | Na poziomie mikrometra | Na poziomie centymetra | Zależne od zasięgu | Od milimetra do centymetra | Od milimetra do centymetra |
| Zakres działania | Krótkie | ~6 metrów | Wysoka skalowalność | Skalowalny | Skalowalny |
| Wydajność w warunkach słabego oświetlenia | Dobre | Słaba | Dobre | Dobre | Dobre |
| Wydajność na zewnątrz | Słaba | Dobre | Dobre | Umiarkowany | Umiarkowany |
| Prędkość skanowania | Powoli. | Średni | Powoli. | Szybko. | Bardzo szybko |
| Kompaktość | Średni | Niski | Niski | Wysoki | Średni |
| Zużycie energii | Wysoki | Niska do skalowalnej | Wysoka do skalowalnej | Średni | Skalowalne do średniej |
technologia kamer 3D przeszła z laboratorium do zastosowań komercyjnych, a jej różnorodne możliwości rewolucjonizują różne branże.
Kamery głębokości stosowane w robotyce pełnią funkcję „organów percepcji przestrzennej” robotów. W zautomatyzowanych liniach produkcyjnych roboty muszą dokładnie identyfikować i chwytać elementy robocze ułożone przypadkowo. Kamery 3D generują wysoce dokładne dane chmury punktów, pomagając robotom zrozumieć trójwymiarową pozycję i orientację obiektów, co umożliwia precyzyjne chwytywanie, sortowanie i montaż, znacznie zwiększając wydajność i elastyczność produkcji.
Urządzenia AR/VR wymagają rzeczywistego czasu świadomości otoczenia, aby bezproblemowo integrować obiekty wirtualne ze światem rzeczywistym. Kamery głębokości mogą wykonać trójwymiarowe skanowanie pokoju użytkownika i wygenerować dokładną mapę głębokości. Dzięki temu obiekty wirtualne mogą być precyzyjnie umieszczane na powierzchni stołu lub ukrywane za rzeczywistymi obiektami, co znacznie poprawia immersyjne i interaktywne doświadczenie użytkownika.
Zautomatyzowane magazynowanie, pomiar objętości przesyłek oraz paletyzacja są kluczowymi wymaganiami w branży logistycznej. Kamery 3D pozwalają szybko zmierzyć objętość i wagę przesyłek w celu zoptymalizowania załadunku pojazdów ciężarowych. W zautomatyzowanych magazynach mogą one kierować robotami, umożliwiając im dokładne pobieranie i umieszczanie przedmiotów na półkach oraz wykonywanie inwentaryzacji, co zapewnia efektywne zarządzanie magazynem.
W dziedzinie opieki zdrowotnej kamery 3D mogą być wykorzystywane do bezdotykowego pomiaru ciała, analizy postawy oraz planowania zabiegów chirurgicznych. Dzięki skanowaniu 3D kamery głębokości pozwalają tworzyć modele ludzkiego ciała do produkcji indywidualnie dopasowanych protez i ortez. W biometrii umożliwiają identyfikację unikalnej geometrii twarzy, zapewniając bardziej bezpieczną autentykację i zapobiegając oszustwom przy użyciu zdjęć lub nagrania wideo.
Kamery wykrywające głębokość stanowią istotny postęp technologiczny w dziedzinie wizji wbudowanej. Niezależnie od tego, czy chodzi o światło strukturalne, czas przelotu (ToF), czy stereowizję, każda z tych technologii oferuje unikalne rozwiązania do percepcji trójwymiarowej. Zrozumienie zasad działania i cech poszczególnych typów kamer głębokości oraz ich precyzyjny dobór w zależności od scenariusza zastosowania (np. kamery głębokości do robotyki) jest kluczowe dla każdego inżyniera zajmującego się wizją maszynową. Kamery głębokości wyposażają maszyny w zdolność postrzegania trójwymiarowego świata i napędzają głęboką transformację od automatyzacji ku inteligencji.
Czy masz trudności z wybraniem odpowiedniej kamery głębokości do swojego projektu? Skontaktuj się już dziś z naszym zespołem ekspertów, aby uzyskać profesjonalną pomoc w zakresie wbudowanego widzenia i rozwiązań percepcji 3D – pomożemy Ci zbudować najlepszy system widzenia maszynowego dla Twojej aplikacji.
Gorące wiadomości2025-08-21
2025-08-16
2025-08-15