Tradisjonelle 2D-kameraer ser bare en flat, todimensjonal verden. De kan gjenkjenne form og farge på objekter, men ikke forstå deres posisjon, størrelse eller avstand i rommet. Dette begrenser evnen til mange avanserte robot- og automatiseringsapplikasjoner. Oppkomsten av dybdesensor-kameraer har endret dette. De gir maskiner en ny «tredimensjonal» persepsjonskapasitet, noe som gjør at systemer kan forstå rom på samme måte som mennesker, og åpner opp et stort anvendelsesområde for innbygde visjonsløsninger og 3D-persepsjon.
Som rådgiver som spesialiserer seg på kameramoduler vil denne artikkelen gi en grundig analyse av teknologien bak dybdesensor-kameraer, de viktigste typene og deres anvendelser innen robotikk, logistikk og AR/VR. Vi vil undersøke egenskapene til hver teknologi for å hjelpe ingeniører med å forstå hvordan dybdesensor-kameraer fungerer og ta den mest informerte beslutningen for sine prosjekter.
Et dytesensor-kamera, som ofte også kalles et 3D-kamera, er et kamera som kan registrere dyteinformasjon for hver piksel i et bilde. Det gir ikke bare et tradisjonelt RGB-bilde, men også et dytekart eller punktskydata. Hver pikselverdi i et dytekart representerer avstanden mellom det punktet og kameraet.
3D-kameraer er nødvendige fordi 2D-bilder ikke kan løse et grunnleggende problem innen visjon: romlig tvetydighet. Et 2D-kamera kan ikke skille mellom et lite objekt som er nær og et stort objekt som er langt unna. Videre kan variasjoner i belysning, skygger og overlapp gjøre at 2D-visjonssystemer svikter. For eksempel kan et objekt i skygge misforstås som et annet objekt eller rett og slett ikke oppdages.

Dybdekameraer løser dette problemet perfekt ved å gi nøyaktig avstandsinformasjon. De gir maskiner geometrisk informasjon som ikke påvirkes av belysning, farge og struktur. Denne evnen til tredimensjonal persepsjon basert på form gjør at maskiner kan forstå og samhandle med den virkelige verden, og legger grunnlaget for realiseringen av innebygde 3D-persepsjonsløsninger for bildebehandling.
Av alle dybdesensor-teknologiene som er tilgjengelige i dag er de tre mest populære og vanligste:
1. Strukturert lys
2. Tidsforløp (Time of Flight)
2.1 Direkte tidsforløp (dToF)
2.1.1 LiDAR
2.2 Indirekte tidsforløp (iToF)
3. Stereo-syn
La oss deretter se nærmere på hvordan hver av disse dybdesensor-teknologiene fungerer.
For å forstå hvordan dybdesensor-kameraer fungerer, er det viktig å ha en grundig forståelse av de sentrale typene dybdekamerateknologi som ligger bak dem. For tiden finnes det tre dominerende typer dybdekamerateknologi.
Et strukturert lyskamera er en aktiv avbildningsteknologi. Den bruker en kraftig infrarød prosjektor for å projisere et kjent lysmønster, for eksempel et spesifikt mønster bestående av flere tusen punkter, på en scene. Deretter brukes ett eller flere kameraer til å fange opp forvrengningen av dette mønsteret på overflaten til et objekt. Ved å beregne denne forvrengningen kan kameraet utlede objektets tredimensjonale form og avstand.
Denne teknologien gir svært nøyaktige og høyoppløselige dybdegitter, spesielt i nære avstander. Dens undermillimetermålingskapasitet er fremragende i applikasjoner som krever nøyaktig måling av objektdetaljer. Imidlertid kan det projiserte lyset påvirkes av omgivende lys (spesielt sterkt sollys), noe som kan påvirke målenøyaktigheten. Videre kan projeksjonsmønstrene fra flere strukturerte lyskameraer som brukes i samme rom forstyrre hverandre.
Tids-til-flyt-kameraer (Time-of-Flight-kameraer), som bygger på prinsippet om lysets konstante hastighet, sender ut infrarødt lys og måler tiden det tar for lyspulsen å reflekteres tilbake til kameraets sensor. Basert på denne tidsforskjellen kan avstanden mellom objektet og kameraet nøyaktig beregnes. Denne prosessen utføres vanligvis parallelt for hver piksel, noe som muliggjør dybdefangst med høy bildefrekvens.
Avhengig av metoden som brukes til å bestemme avstanden, deles ToF inn i to typer: direkte tids-til-flyt (DToF) og indirekte tids-til-flyt (iToF).
dToF måler direkte tiden fra når en lyspuls sendes ut til den kommer tilbake. Det brukes en dedikert sensor for å nøyaktig registrere ankomsttiden til enkeltfotoner. Denne direkte målemetoden muliggjør lengre måleavstander og høyere nøyaktighet.
LiDAR (laser-radar) er en type dToF-teknologi. Den bruker vanligvis en laserskanner for å sende ut laserlys punkt for punkt i et område og motta det reflekterte lyset for å generere en høyoppløselig punktsky. LiDARs lange deteksjonsrekkevidde og sterke motstand mot omgivende lys gjør den ideell for autonom kjøring og høyoppløselig kartlegging for roboter.
iToF måler ikke tiden direkte. I stedet sender den ut en kontinuerlig modulert lysbølge og måler faseforskjellen mellom det reflekterte og det utsendte lyset. Denne faseforskjellen er proporsjonal med lysets flyttid. iToF-systemer er vanligvis mer kompakte, bruker mindre strøm og oppnår høyere bildefrekvenser. De er egnet for korte avstander innendørs, som f.eks. gestikkerkjenning og ansiktsautentisering.
En stereovisjonskamera etterligner menneskelig binokulær syn. Den bruker to kameraer, montert med en fast avstand mellom dem, for å samtidig ta bilder av samme scene. Ved hjelp av komplekse algoritmer finner systemet tilsvarende punkter i de to bildene og beregner, ved hjelp av trianguleringsprinsipper, posisjonen til hvert punkt i tredimensjonalt rom, og genererer et dybdemaps.
Denne passive teknologien krever ingen ekstra lyskilde, noe som gjør den egnet for utendørsbruk og miljøer med rikelig naturlig lys. Den gir dybdemapper med høy oppløsning som ikke påvirkes av objektets materiale. Stereovisjon er imidlertid beregningsintensiv og krever en kraftig prosessor for å utføre bildekorrelasjon. Den har også problemer i områder uten struktur (som hvite vegger eller flate fargede overflater), fordi algoritmen ikke kan finne tilsvarende punkter.
| Eiendom | STRUKTURERT LYS | STEREOVISJON | LiDAR | dToF | iToF |
| Prinsipp | Prosjisert mønsterforvrengning | Dualkamera bildekomparasjon | Tid-av-flukt for reflektert lys | Tid-av-flukt for reflektert lys | Faseforskyving av modulert lyspulse |
| Programvarekompleksitet | Høy | Høy | Låg | Låg | Medium |
| Kostnad | Høy | Låg | Variabel | Låg | Medium |
| Nøyaktighet | Mikrometer-nivå | Centimeter-nivå | Avstand-avhengig | Millimeter til centimeter | Millimeter til centimeter |
| Driftsområde | Kort | ~6 meter | Høy grad av skalering | Skalerbar | Skalerbar |
| Prestande i mørkt lys | God | Svak | God | God | God |
| Utendørs ytelse | Svak | God | God | Måttlig | Måttlig |
| Skanningshastighet | Langsom | Medium | Langsom | Rask | Veldig rask |
| Kompaktitet | Medium | Låg | Låg | Høy | Medium |
| Strømforbruk | Høy | Lav til skalerbar | Høy til skalerbar | Medium | Skalerbar til medium |
3D-kamerateknologi har gått fra laboratoriet til kommersiell bruk, og dens mangfoldige evner revolusjonerer ulike industrier.
Dybdekameraer for robotikk fungerer som robotenes «romlige oppfattelsesorganer». I automatiserte produksjonslinjer må roboter nøyaktig identifisere og gripe arbeidsstykker som er stokket tilfeldig. 3D-kameraer kan generere svært nøyaktige punktskydata, noe som hjelper roboter med å forstå den tredimensjonale posisjonen og orienteringen til objekter, og dermed muliggjøre nøyaktig gripping, sortering og montering – noe som betydelig forbedrer produksjonseffektiviteten og fleksibiliteten.
AR/VR-enheter krever sanntidsbevissthet om miljøet for å naht integrere virtuelle objekter i den virkelige verden. Dypdekameraer kan utføre en tredimensjonal skanning av brukerens rom og generere et nøyaktig dypdemappe. Dette gjør det mulig å plassere virtuelle objekter nøyaktig på et bord eller skjule dem bak reelle objekter, noe som betydelig forbedrer brukerens immersive og interaktive opplevelse.
Automatisert lagerholding, måling av pakkevolum og pallisering er grunnleggende krav i logistikkbransjen. 3D-kameraer kan raskt måle volum og vekt av pakker for å optimalisere lastingen av lastebiler. I automatiserte lageranlegg kan de veilede roboter til å nøyaktig plukke og plassere varer fra hyller og utføre lagerinventar, noe som muliggjør effektiv lagerstyring.
I helsevesenet kan 3D-kameraer brukes til kontaktløs kroppsmåling, stillingsanalyse og kirurgisk planlegging. Ved hjelp av 3D-scanning kan dypdekameraer generere menneskelige modeller for tilpassede proteser og ortoser. I biometri kan de identifisere unik ansiktsgeometri for å gi sikrere autentisering og forhindre svindel ved hjelp av bilder eller videoer.
Kameraer med dyptesensing representerer en betydelig teknologisk fremskritt innenfor feltet innebygd visjon. Uansett om det er strukturert lys, tid-til-flyt (time-of-flight) eller binokulær visjon, tilbyr hver teknologi unike løsninger for 3D-opptak. Å forstå prinsippene og egenskapene til disse typene dypdekameraer og velge dem nøyaktig basert på anvendelsesscenariet (for eksempel dypdekameraer for robotikk) er avgjørende for alle ingeniører innen maskinvision. Dypdekameraer gir maskiner evnen til å oppfatte den tredimensjonale verden og driver en dypgående transformasjon fra automatisering til intelligens.
Har du problemer med å velge den rette dybderekameraet for prosjektet ditt? Kontakt vårt ekspertteam i dag for profesjonell rådgivning innen innebygd bildebehandling og 3D-oppfattelse, og la oss hjelpe deg med å bygge det beste maskinbildebehandlingssystemet for ditt brukstilfelle.