دوربینهای سنتی دو بعدی تنها جهانی تخت و دوبعدی را میبینند. این دوربینها میتوانند شکل و رنگ اشیا را تشخیص دهند، اما نمیتوانند موقعیت، اندازه یا فاصلهٔ آنها در فضا را درک کنند. این امر قابلیتهای بسیاری از کاربردهای پیشرفته رباتیک و اتوماسیون را محدود میسازد. ظهور دوربینهای تشخیص عمق این وضعیت را تغییر داده است. این دوربینها قابلیت ادراک «سهبعدی» جدیدی به ماشینها میدهند و امکان درک فضا را بهصورتی مشابه انسان فراهم میسازند؛ که این امر حوزهٔ گستردهای از کاربردها را برای راهحلهای بینایی تعبیهشده و ادراک سهبعدی باز میکند.
بهعنوان مشاوری متخصص در زمینهٔ ماژولهای دوربین، این مقاله تحلیلی عمیق از فناوری دوربینهای تشخیص عمق، انواع اصلی آن و کاربردهایشان در رباتیک، لجستیک و واقعیت افزوده/واقعیت مجازی (AR/VR) ارائه میدهد. ما ویژگیهای هر فناوری را بررسی خواهیم کرد تا به مهندسان کمک کنیم تا نحوهٔ عملکرد دوربینهای تشخیص عمق را درک کرده و بهترین انتخاب را برای پروژههای خود داشته باشند.
دوربین تشخیص عمق، که اغلب با نام دوربین سهبعدی نیز شناخته میشود، نوعی دوربین است که میتواند اطلاعات عمق را برای هر پیکسل در یک صحنه ثبت کند. این دوربین نهتنها تصویر سنتی RGB را تولید میکند، بلکه نقشه عمق یا دادههای ابر نقطهای را نیز خروجی میدهد. هر مقدار پیکسل در یک نقشه عمق فاصله بین آن نقطه و دوربین را نشان میدهد.
به دوربینهای سهبعدی بهدلیل اینکه تصاویر دوبعدی نمیتوانند مشکل اصلی در بینایی را حل کنند—یعنی ابهام فضایی—نیاز است. یک دوربین دوبعدی نمیتواند بین یک شیء کوچک در فاصله نزدیک و یک شیء بزرگ در فاصله دور تمایز قائل شود. علاوه بر این، تغییرات نور، سایهها و پوشاندن شیء (اکلوژن) میتوانند منجر به شکست سیستمهای بینایی دوبعدی شوند. بهعنوان مثال، شیءای که در سایه قرار دارد ممکن است بهاشتباه بهعنوان شیء دیگری شناسایی شود یا اصلاً تشخیص داده نشود.

دوربینهای عمقسنج بهطور کامل این مشکل را با ارائه اطلاعات دقیق فاصله حل میکنند. این دوربینها اطلاعات هندسی را در اختیار ماشینها قرار میدهند که تحت تأثیر نور، رنگ و بافت قرار نمیگیرند. این قابلیت ادراک مبتنی بر شکل سهبعدی، ماشینها را قادر میسازد تا جهان واقعی را درک کرده و با آن تعامل داشته باشند و پایهای برای پیادهسازی راهحلهای بینایی تعبیهشده سهبعدی فراهم میکند.
از میان تمام فناوریهای موجود امروزی برای سنجش عمق، سه فناوری محبوب و رایجتر عبارتند از:
۱. نور ساختاریافته
۲. زمان پرواز
۲.۱ زمان پرواز مستقیم (dToF)
۲.۱.۱ لیدار
۲.۲ زمان پرواز غیرمستقیم (iToF)
۳. بینایی استریو
در ادامه، بهصورت دقیقتر به بررسی نحوه عملکرد هر یک از این فناوریهای سنجش عمق میپردازیم.
برای درک نحوه عملکرد دوربینهای سنجش عمق، درک عمیق انواع اصلی فناوریهای دوربین عمقسنج که پشت آنها قرار دارند ضروری است. در حال حاضر، سه فناوری اصلی و رایج دوربین عمقسنج وجود دارد.
دوربین نور ساختاریافته فناوری تصویربرداری فعالی است. این دوربین از یک پروژکتور مادون قرمز با توان بالا برای پرتاب الگوی نوری شناختهشده، مانند الگوی خاصی متشکل از هزاران نقطه، بر روی یک صحنه استفاده میکند. سپس از یک یا چند دوربین برای ثبت اعوجاج این الگو روی سطح یک شیء بهره میبرد. با محاسبه این اعوجاج، دوربین میتواند شکل سهبعدی و فاصله آن شیء را استنباط کند.
این فناوری دادههای عمقی بسیار دقیق و با وضوح بالا، بهویژه در فواصل نزدیک، ارائه میدهد. توانایی اندازهگیری آن در مقیاس زیرمیلیمتری، در کاربردهایی که نیازمند اندازهگیری دقیق جزئیات اشیاء هستند، برجسته است. با این حال، نور پرتابشده ممکن است تحت تأثیر نور محیطی (بهویژه نور خورشید شدید) قرار گیرد و دقت اندازهگیری را تحت تأثیر قرار دهد. علاوه بر این، در صورت استفاده همزمان چندین دوربین نور ساختاریافته در یک فضای مشترک، الگوهای پرتابی آنها ممکن است با یکدیگر تداخل داشته باشند.
دوربینهای زمان پرواز (Time-of-Flight)، بر اساس اصل ثابت بودن سرعت نور، نور مادون قرمز ساطع کرده و زمان لازم برای بازگشت پالس نور به سنسور دوربین را اندازهگیری میکنند. با استفاده از این تفاوت زمانی، فاصله بین شیء و دوربین بهطور دقیق محاسبه میشود. این فرآیند معمولاً بهصورت موازی در هر پیکسل انجام میشود و امکان ثبت عمق با نرخ فریم بالا را فراهم میکند.
با توجه به روشی که برای تعیین فاصله به کار میرود، زمان پرواز (ToF) به دو نوع تقسیم میشود: زمان پرواز مستقیم (DToF) و زمان پرواز غیرمستقیم (iToF).
dToF زمان پرواز یک پالس نور را از لحظه انتشار تا بازگشت بهصورت مستقیم اندازهگیری میکند. این روش از یک سنسور اختصاصی برای تشخیص دقیق زمان رسیدن فوتونهای منفرد استفاده میکند. این روش اندازهگیری مستقیم، امکان اندازهگیری فواصل طولانیتر و دقت بالاتری را فراهم میکند.
لیدار (رادار لیزری) نوعی فناوری dToF است. این فناوری معمولاً از یک اسکنر لیزری برای ارسال نور لیزر بهصورت نقطهبهنقطه در یک صحنه و دریافت نور بازتابیده استفاده میکند تا ابری از نقاط با دقت بالا ایجاد کند. برد تشخیص بلند و مقاومت قوی لیدار در برابر نور محیطی، آن را برای رانندگی خودکار و نقشهبرداری با دقت بالا در رباتها ایدهآل میسازد.
iToF زمان را بهصورت مستقیم اندازهگیری نمیکند. بلکه یک موج نور مدولهشدهٔ پیوسته را ارسال کرده و اختلاف فاز بین نور بازتابیده و نور ارسالی را اندازهگیری میکند. این اختلاف فاز با زمان پرواز نور متناسب است. سیستمهای iToF معمولاً جمعوجورتر، مصرفکنندهٔ انرژی کمتر و با نرخ فریم بالاتری هستند و برای کاربردهای کوتاهبرد در محیطهای داخلی مانند تشخیص حرکت و احراز هویت صورت مناسب هستند.
دوربین بینایی استریو، بینایی دوچشمی انسان را تقلید میکند. این دوربین از دو دوربین تشکیل شده که در فاصلهٔ ثابتی از یکدیگر نصب شدهاند و بهصورت همزمان صحنهٔ یکسانی را ضبط میکنند. سیستم با استفاده از الگوریتمهای پیچیده، نقاط متناظر را در دو تصویر پیدا کرده و با بهکارگیری اصول مثلثسنجی، موقعیت هر نقطه را در فضای سهبعدی محاسبه میکند و نقشهٔ اختلاف (disparity map) تولید مینماید.
این فناوری غیرفعال نیازی به منبع نور اضافی ندارد و بنابراین برای استفاده در فضای باز و محیطهایی با نور طبیعی کافی مناسب است. این فناوری نقشههای عمق با وضوح بالا ارائه میدهد که تحت تأثیر جنس سطح شیء قرار نمیگیرند. با این حال، بینایی استریو از نظر محاسباتی بسیار پرهزینه است و نیازمند پردازندهای قدرتمند برای انجام عملیات تطبیق تصاویر میباشد. همچنین در نواحی بدون بافت (مانند دیوارهای سفید یا سطوح تکرنگ) عملکرد ضعیفی دارد، زیرا الگوریتم قادر به یافتن نقاط متناظر نیست.
| اموال | نور ساختاری | چشم انداز استریو | لیدار | dToF | iToF |
| اصل | تشویش الگوی پروژهشده | مقایسه تصاویر دوربین دوگانه | زمان پرواز نور بازتابیده | زمان پرواز نور بازتابیده | جابجایی فاز نور پالس مدوله شده |
| پیچیدگی نرم افزار | بالا | بالا | کم | کم | متوسط |
| هزینه | بالا | کم | متغیر | کم | متوسط |
| دقت | سطح میکرومتری | سطح سانتیمتری | وابسته به محدوده | میلیمتر تا سانتیمتر | میلیمتر تا سانتیمتر |
| دامنه عملیاتی | کورس کوتاه | ~6 متر | بسیار قابل اسکاله کردن | مقیاس پذیر | مقیاس پذیر |
| عملکرد در شرایط نور کم | خوبه | ضعيف | خوبه | خوبه | خوبه |
| عملکرد در محیط خارج از ساختمان | ضعيف | خوبه | خوبه | متوسط | متوسط |
| سرعت اسکن | آهسته | متوسط | آهسته | سریع | خیلی سریع |
| فشرده سازی | متوسط | کم | کم | بالا | متوسط |
| مصرف برق | بالا | کم تا قابل اسکاله کردن | بالا تا قابل مقیاس | متوسط | قابل مقیاس تا متوسط |
فناوری دوربینهای سهبعدی از آزمایشگاه به کاربرد تجاری منتقل شده است و قابلیتهای متنوع آن در حال دگرگونی صنایع مختلف است.
دوربینهای عمق برای رباتها بهعنوان «اَرگانهای ادراک فضایی» رباتها عمل میکنند. در خطوط تولید خودکار، رباتها باید قطعات کاری که بهصورت تصادفی روی هم چیده شدهاند را بهدرستی شناسایی و گرفتن کنند. دوربینهای سهبعدی میتوانند دادههای ابر نقطهای بسیار دقیقی تولید کنند که به رباتها کمک میکند تا موقعیت و جهت سهبعدی اشیاء را درک کنند و این امر امکان گرفتن دقیق، مرتبسازی و مونتاژ را فراهم میآورد و بهطور قابلتوجهی بازدهی و انعطافپذیری تولید را افزایش میدهد.
دستگاههای واقعیت افزوده/واقعیت مجازی (AR/VR) برای یکپارچهسازی بیدرز اشیاء مجازی در دنیای واقعی، نیازمند آگاهی بلادرنگ از محیط هستند. دوربینهای عمقسنج میتوانند اتاق کاربر را بهصورت سهبعدی اسکن کرده و نقشه عمق دقیقی تولید کنند. این امر امکان قرارگیری دقیق اشیاء مجازی روی سطح میز یا پنهانشدن آنها پشت اشیاء واقعی را فراهم میکند و تجربه غوطهوری و تعاملی کاربر را بهطور قابلتوجهی بهبود میبخشد.
انبارداری خودکار، اندازهگیری حجم بستهها و چیدمان بستهها روی پالتها از نیازمندیهای اصلی در صنعت لجستیک هستند. دوربینهای سهبعدی میتوانند بهسرعت حجم و وزن بستهها را اندازهگیری کرده و بارگیری کامیونها را بهینهسازی نمایند. در انبارهای خودکار، این دوربینها میتوانند رباتها را راهنمایی کنند تا اقلام را با دقت از قفسهها بردارند و در مکانهای تعیینشده قرار دهند و همچنین شمارش موجودی را انجام دهند تا مدیریت کارآمد انبار ممکن گردد.
در حوزه مراقبتهای بهداشتی و درمانی، دوربینهای سهبعدی میتوانند برای اندازهگیری بیتماس بدن، تحلیل وضعیت بدن و برنامهریزی جراحی استفاده شوند. با استفاده از اسکن سهبعدی، دوربینهای عمقسنج میتوانند مدلهای سهبعدی انسان را تولید کرده و برای ساخت پروتزها و ارتوزهای سفارشی به کار روند. در زمینه بیومتریک، این دوربینها قادر به شناسایی هندسه منحصربهفرد صورت هستند و از این طریق احراز هویت امنتری فراهم میکنند و از کلاهبرداری با عکس یا فیلم جلوگیری مینمایند.
دوربینهای حسکننده عمق، پیشرفتی فناورانه قابل توجه در حوزه بینایی تعبیهشده هستند. آیا این فناوری بر پایه نور ساختاریافته، زمان پرواز یا دید دوچشمی باشد، هر یک از این روشها راهحلهای منحصر بهفردی برای ادراک سهبعدی ارائه میدهند. درک اصول و ویژگیهای این انواع دوربینهای عمق و انتخاب دقیق آنها بر اساس سناریوی کاربردی (مانند دوربینهای عمق برای رباتیک) برای هر مهندس بینایی ماشین ضروری است. دوربینهای عمق، ماشینها را با توانایی ادراک جهان سهبعدی مجهز میکنند و تحول عمیقی از خودکارسازی به سمت هوشمندسازی ایجاد مینمایند.
آیا در انتخاب دوربین عمق مناسب برای پروژه خود دچار مشکل هستید؟ امروز با تیم متخصصان ما تماس بگیرید تا از مشاوره حرفهای در زمینه بینایی تعبیهشده و راهحلهای ادراک سهبعدی بهرهمند شوید و بهترین سیستم بینایی ماشینی را برای کاربرد خود بسازید.