চিরাচরিত ২ডি ক্যামেরাগুলি শুধুমাত্র একটি সমতল, দ্বিমাত্রিক বিশ্বকে দেখতে পায়। এগুলি বস্তুর আকৃতি ও রং চিনতে পারে, কিন্তু বস্তুগুলির স্থান, আকার বা স্থানের দূরত্ব বুঝতে পারে না। এটি অনেক উন্নত রোবটিক্স ও স্বয়ংক্রিয়করণ অ্যাপ্লিকেশনের ক্ষমতাকে সীমিত করে। গভীরতা-সংবেদনশীল ক্যামেরার উদ্ভাবন এই পরিস্থিতি পরিবর্তন করেছে। এগুলি মেশিনগুলিকে একটি নতুন "ত্রিমাত্রিক" ধারণার ক্ষমতা প্রদান করে, যা সিস্টেমগুলিকে মানুষের মতো স্থান বুঝতে সক্ষম করে এবং এম্বেডেড ভিশন ও ৩ডি ধারণা সমাধানের জন্য বিশাল অ্যাপ্লিকেশন স্পেস খোলে।
ক্যামেরা মডিউলে বিশেষজ্ঞ একজন কনসালট্যান্ট হিসেবে, এই নিবন্ধটি গভীরতা-সংবেদনশীল ক্যামেরা প্রযুক্তি, এর প্রধান প্রকারগুলি এবং রোবটিক্স, যানবাহন ও আর/ভিআর-এ এর অ্যাপ্লিকেশনগুলির একটি গভীর বিশ্লেষণ প্রদান করবে। আমরা প্রতিটি প্রযুক্তির বৈশিষ্ট্যগুলি অন্বেষণ করব যাতে ইঞ্জিনিয়াররা গভীরতা-সংবেদনশীল ক্যামেরাগুলি কীভাবে কাজ করে তা বুঝতে পারেন এবং তাদের প্রকল্পের জন্য সবচেয়ে সঠিক পছন্দ করতে পারেন।
গভীরতা অনুভবকারী ক্যামেরা, যা প্রায়শই ৩ডি ক্যামেরা নামেও পরিচিত, একটি ক্যামেরা যা কোনো দৃশ্যের প্রতিটি পিক্সেলের জন্য গভীরতা তথ্য ধারণ করতে পারে। এটি শুধুমাত্র একটি ঐতিহ্যবাহী আরজিবি (RGB) ছবি নয়, বরং একটি গভীরতা মানচিত্র বা পয়েন্ট ক্লাউড ডেটা ও আউটপুট করে। গভীরতা মানচিত্রের প্রতিটি পিক্সেল মান সেই বিন্দু এবং ক্যামেরার মধ্যে দূরত্ব নির্দেশ করে।
৩ডি ক্যামেরা প্রয়োজন কারণ ২ডি ছবিগুলি দৃষ্টির একটি মৌলিক সমস্যা—স্থানিক অস্পষ্টতা—সমাধান করতে পারে না। একটি ২ডি ক্যামেরা কোনো ছোট বস্তুকে কাছ থেকে দেখলে এবং একটি বড় বস্তুকে দূর থেকে দেখলে তাদের মধ্যে পার্থক্য করতে পারে না। তদুপরি, আলোর পরিবর্তন, ছায়া এবং আচ্ছাদন সবগুলোই ২ডি দৃষ্টি সিস্টেমের ব্যর্থতার কারণ হতে পারে। উদাহরণস্বরূপ, কোনো ছায়ায় অবস্থিত বস্তুকে অন্য কোনো বস্তু ভাবা হতে পারে অথবা সেটি সম্পূর্ণরূপে শনাক্ত করা হতে পারে না।

গভীরতা ক্যামেরাগুলি এই সমস্যার সঠিক সমাধান প্রদান করে যার মাধ্যমে সঠিক দূরত্বের তথ্য পাওয়া যায়। এগুলি মেশিনগুলিকে আলো, রং এবং টেক্সচারের প্রভাব থেকে মুক্ত জ্যামিতিক তথ্য প্রদান করে। এই ৩ডি আকৃতি-ভিত্তিক ধারণার ক্ষমতা মেশিনগুলিকে বাস্তব বিশ্বকে বুঝতে এবং তার সঙ্গে মিথস্ক্রিয়া করতে সক্ষম করে, যা এম্বেডেড ভিশন ৩ডি ধারণা সমাধানগুলির বাস্তবায়নের ভিত্তি গঠন করে।
বর্তমানে উপলব্ধ সমস্ত গভীরতা সংবেদন প্রযুক্তির মধ্যে, তিনটি সবচেয়ে জনপ্রিয় এবং সাধারণত ব্যবহৃত প্রযুক্তি হলো:
1. স্ট্রাকচারড লাইট
২. ফ্লাইটের সময়
২.১ সরাসরি ফ্লাইটের সময় (dToF)
২.১.১ লাইডার
২.২ অপ্রত্যক্ষ ফ্লাইটের সময় (iToF)
৩. স্টেরিও ভিশন
এখন, আসুন এই গভীরতা সংবেদন প্রযুক্তিগুলির প্রত্যেকটি কীভাবে কাজ করে তা আরও বিস্তারিতভাবে দেখি।
গভীরতা-সংবেদন ক্যামেরাগুলি কীভাবে কাজ করে তা বোঝার জন্য এদের পেছনে থাকা গভীরতা ক্যামেরা প্রযুক্তির মূল ধরনগুলির গভীর বোঝাপড়া থাকা অত্যন্ত গুরুত্বপূর্ণ। বর্তমানে গভীরতা ক্যামেরার তিনটি প্রধান প্রচলিত প্রযুক্তি রয়েছে।
স্ট্রাকচার্ড লাইট ক্যামেরা হলো একটি সক্রিয় ইমেজিং প্রযুক্তি। এটি উচ্চ-শক্তির অবলোহিত প্রোজেক্টর ব্যবহার করে একটি পরিচিত আলোক প্যাটার্ন—যেমন, হাজার হাজার বিন্দু দিয়ে গঠিত একটি নির্দিষ্ট প্যাটার্ন—দৃশ্যের উপর প্রক্ষেপণ করে। অতঃপর এক বা একাধিক ক্যামেরা ব্যবহার করে বস্তুর পৃষ্ঠে এই প্যাটার্নের বিকৃতি ধারণ করে। এই বিকৃতির গণনা করে ক্যামেরাটি বস্তুটির ৩ডি আকৃতি এবং দূরত্ব নির্ণয় করতে পারে।
এই প্রযুক্তিটি বিশেষ করে কাছের দূরত্বে অত্যন্ত নির্ভুল ও উচ্চ-রেজোলিউশনের গভীরতা ডেটা প্রদান করে। এর সাব-মিলিমিটার পরিমাপ ক্ষমতা বস্তুর বিস্তারিত বৈশিষ্ট্যগুলির সূক্ষ্ম পরিমাপের প্রয়োজনীয় অ্যাপ্লিকেশনগুলিতে অত্যন্ত কার্যকর। তবে প্রক্ষেপিত আলোকে পরিবেশগত আলো (বিশেষ করে তীব্র সূর্যালোক) প্রভাবিত করতে পারে, যা পরিমাপের নির্ভুলতা কমিয়ে দেয়। এছাড়া, যখন একই স্থানে একাধিক স্ট্রাকচার্ড লাইট ক্যামেরা ব্যবহার করা হয়, তখন তাদের প্রক্ষেপিত প্যাটার্নগুলি পরস্পরের সঙ্গে ব্যাঘাত সৃষ্টি করতে পারে।
সময়-অফ-ফ্লাইট (টাইম-অফ-ফ্লাইট) ক্যামেরা আলোর ধ্রুব গতির নীতির উপর ভিত্তি করে কাজ করে; এগুলো অবলোহিত আলো নির্গত করে এবং আলোর পালসটি ক্যামেরা সেন্সরে ফিরে আসতে যে সময় লাগে তা পরিমাপ করে। এই সময়ের পার্থক্যের ভিত্তিতে বস্তু ও ক্যামেরার মধ্যবর্তী দূরত্ব সঠিকভাবে গণনা করা যায়। এই প্রক্রিয়াটি সাধারণত প্রতিটি পিক্সেলে সমান্তরালভাবে সম্পাদন করা হয়, যা উচ্চ-ফ্রেম-রেটে গভীরতা ধারণের অনুমতি দেয়।
দূরত্ব নির্ণয়ের জন্য ব্যবহৃত পদ্ধতির উপর নির্ভর করে টাইম-অফ-ফ্লাইট (ToF) কে দুটি ধরনে ভাগ করা হয়: সরাসরি সময়-অফ-ফ্লাইট (DToF) এবং পরোক্ষ সময়-অফ-ফ্লাইট (iToF)।
dToF আলোর পালসের নির্গমন থেকে প্রত্যাবর্তন পর্যন্ত সরাসরি সময়-অফ-ফ্লাইট পরিমাপ করে। এটি পৃথক ফোটনগুলির আগমন সময় সঠিকভাবে শনাক্ত করার জন্য একটি বিশেষায়িত সেন্সর ব্যবহার করে। এই সরাসরি পরিমাপ পদ্ধতিটি দীর্ঘতর পরিমাপের দূরত্ব এবং উচ্চতর নির্ভুলতা সম্ভব করে তোলে।
লাইডার (লেজার রাডার) হলো dToF প্রযুক্তির একটি ধরন। এটি সাধারণত একটি লেজার স্ক্যানার ব্যবহার করে কোনো দৃশ্যে বিন্দু বিন্দু লেজার আলো নির্গত করে এবং প্রতিফলিত আলো গ্রহণ করে উচ্চ-নির্ভুলতাসম্পন্ন পয়েন্ট ক্লাউড তৈরি করে। লাইডারের দীর্ঘ সনাক্তকরণ পরিসর এবং পরিবেশগত আলোর প্রতি শক্তিশালী প্রতিরোধ ক্ষমতা এটিকে স্বয়ংক্রিয় চালনা এবং রোবটের জন্য উচ্চ-নির্ভুলতাসম্পন্ন ম্যাপিং-এর জন্য আদর্শ করে তোলে।
iToF সময় সরাসরি পরিমাপ করে না। পরিবর্তে, এটি একটি অবিচ্ছিন্ন মডুলেটেড আলোক তরঙ্গ নির্গত করে এবং প্রতিফলিত ও নির্গত আলোর মধ্যে দশা পার্থক্য পরিমাপ করে। এই দশা পার্থক্য আলোর সময়-অফ-ফ্লাইটের সমানুপাতিক। iToF সিস্টেমগুলি সাধারণত আকারে ছোট, কম শক্তি খরচ করে এবং উচ্চ ফ্রেম রেট অর্জন করে। এগুলি হাতের ইশারা সনাক্তকরণ এবং মুখের পরিচয় যাচাইয়ের মতো অভ্যন্তরীণ ছোট পরিসরের অ্যাপ্লিকেশনের জন্য উপযুক্ত।
একটি স্টেরিও ভিশন ক্যামেরা মানুষের দ্বিচক্ষু দৃষ্টির অনুকরণ করে। এটি দুটি ক্যামেরা ব্যবহার করে, যেগুলোকে একটি নির্দিষ্ট বেসলাইন দূরত্বে স্থাপন করা হয় এবং একই দৃশ্য একসাথে ধারণ করে। জটিল অ্যালগরিদম ব্যবহার করে সিস্টেমটি দুটি ছবিতে সমতুল্য বিন্দুগুলো খুঁজে বার করে এবং ত্রিভুজীয় নীতির মাধ্যমে প্রতিটি বিন্দুর ত্রিমাত্রিক স্থানে অবস্থান গণনা করে, একটি বৈসম্য মানচিত্র তৈরি করে।
এই নিষ্ক্রিয় প্রযুক্তির জন্য অতিরিক্ত আলোর উৎসের প্রয়োজন হয় না, ফলে এটি বাইরের ব্যবহার এবং প্রচুর পরিমাণে প্রাকৃতিক আলো থাকা পরিবেশের জন্য উপযুক্ত। এটি উচ্চ-রেজোলিউশনের গভীরতা মানচিত্র প্রদান করে যা বস্তুর উপাদান দ্বারা প্রভাবিত হয় না। তবে স্টেরিও ভিশন গণনাগতভাবে ঘনীভূত এবং ছবি মিলানোর জন্য শক্তিশালী প্রসেসরের প্রয়োজন হয়। এটি টেক্সচারহীন অঞ্চলে (যেমন সাদা দেয়াল বা একক রঙের পৃষ্ঠ) সমস্যায় পড়ে কারণ অ্যালগরিদমটি মিলে যাওয়া বিন্দুগুলো খুঁজে পায় না।
| সম্পত্তি | স্ট্রাকচারড লাইট | স্টেরিও ভিশন | লিডার | dToF | iToF |
| নীতি | প্রজেক্টেড প্যাটার্ন ডিস্টোরশন | ডুয়েল ক্যামেরা ইমেজ কম্পারিজন | প্রতিফলিত আলোর টাইম অফ ফ্লাইট | প্রতিফলিত আলোর টাইম অফ ফ্লাইট | অধিবৃত্তিত আলোর পালকের ফেজ সরণ |
| সফটওয়্যার জটিলতা | উচ্চ | উচ্চ | কম | কম | মাঝারি |
| খরচ | উচ্চ | কম | ভেরিএবল | কম | মাঝারি |
| সঠিকতা | মাইক্রোমিটার-স্তরের | সেন্টিমিটার-স্তরের | রেঞ্জ-নির্ভরশীল | মিলিমিটার থেকে সেন্টিমিটার | মিলিমিটার থেকে সেন্টিমিটার |
| কার্যকরী পরিসর | সংক্ষিপ্ত | ~৬ মিটার | বেশি পরিমাণে স্কেলযোগ্য | স্কেলযোগ্য | স্কেলযোগ্য |
| কম আলোর পারফরম্যান্স | ভাল | দুর্বল | ভাল | ভাল | ভাল |
| বাহিরের পারফরম্যান্স | দুর্বল | ভাল | ভাল | মাঝারি | মাঝারি |
| স্ক্যানিং গতি | ধীর | মাঝারি | ধীর | দ্রুত | খুবই দ্রুত |
| সংক্ষিপ্ততা | মাঝারি | কম | কম | উচ্চ | মাঝারি |
| পাওয়ার খরচ | উচ্চ | চালু থেকে স্কেলযোগ্য | উচ্চ থেকে স্কেলযোগ্য | মাঝারি | মাঝারি পর্যন্ত স্কেলেবল |
৩ডি ক্যামেরা প্রযুক্তি গবেষণাগার থেকে বাণিজ্যিক ব্যবহারে চলে এসেছে, এবং এর বিভিন্ন ক্ষমতা বিভিন্ন শিল্পকে রূপান্তরিত করছে।
রোবটিক্সের জন্য গভীরতা ক্যামেরা রোবটগুলির "স্থানিক উদ্বোধন অঙ্গ" হিসেবে কাজ করে। স্বয়ংক্রিয় উৎপাদন লাইনে, রোবটগুলিকে এলোমেলোভাবে সাজানো কাজের টুকরোগুলি সঠিকভাবে চিহ্নিত করে ধরে নিতে হয়। ৩ডি ক্যামেরা অত্যন্ত নির্ভুল পয়েন্ট ক্লাউড ডেটা তৈরি করতে পারে, যা রোবটগুলিকে বস্তুগুলির ত্রিমাত্রিক অবস্থান ও স্থান বুঝতে সাহায্য করে, ফলে সঠিক ধরা, শ্রেণীবিন্যাস ও সংযোজন সম্ভব হয়, যা উৎপাদন দক্ষতা ও নমনীয়তা উল্লেখযোগ্যভাবে বাড়ায়।
AR/VR ডিভাইসগুলির বাস্তব বিশ্বে ভার্চুয়াল অবজেক্টগুলিকে সুষ্ঠুভাবে একীভূত করার জন্য বাস্তব সময়ে পরিবেশের সচেতনতা প্রয়োজন। গভীরতা ক্যামেরা ব্যবহারকারীর ঘরটির ত্রিমাত্রিক স্ক্যান করতে পারে এবং একটি সঠিক গভীরতা মানচিত্র তৈরি করতে পারে। এটি ভার্চুয়াল অবজেক্টগুলিকে একটি টেবিলের উপরে সঠিকভাবে স্থাপন করতে বা বাস্তব বস্তুর পিছনে লুকিয়ে রাখতে সক্ষম করে, যা ব্যবহারকারীর আবেগগত ও মিথস্ক্রিয়ামূলক অভিজ্ঞতা উল্লেখযোগ্যভাবে উন্নত করে।
স্বয়ংক্রিয় গুদামজাতকরণ, প্যাকেজের আয়তন পরিমাপ এবং প্যালেটাইজিং লজিস্টিক্স শিল্পের মূল প্রয়োজনীয়তা। ৩ডি ক্যামেরা গুলি ট্রাকে লোড করার দক্ষতা অপ্টিমাইজ করার জন্য দ্রুত প্যাকেজের আয়তন এবং ওজন পরিমাপ করতে পারে। স্বয়ংক্রিয় গুদামগুলিতে, এগুলি রোবটগুলিকে শেলফ থেকে নির্ভুলভাবে আইটেমগুলি তুলে নেওয়া এবং স্থাপন করা এবং ইনভেন্টরি গণনা করার জন্য নির্দেশনা প্রদান করতে পারে, যার ফলে দক্ষ গুদাম ব্যবস্থাপনা সম্ভব হয়।
স্বাস্থ্যসেবা ক্ষেত্রে, ৩ডি ক্যামেরা সংস্পর্শহীন দেহ পরিমাপ, দেহের অবস্থান বিশ্লেষণ এবং সার্জিক্যাল পরিকল্পনার জন্য ব্যবহার করা যেতে পারে। ৩ডি স্ক্যানিংয়ের মাধ্যমে, গভীরতা সংবেদনশীল ক্যামেরা ব্যক্তিগতকৃত প্রোস্থেটিক্স এবং অর্থোটিক্সের জন্য মানুষের মডেল তৈরি করতে পারে। জৈবমেট্রিক্সে, এগুলি অনন্য মুখের জ্যামিতিক বৈশিষ্ট্য চিহ্নিত করতে পারে, যা আরও নিরাপদ প্রমাণীকরণ প্রদান করে এবং ফটো বা ভিডিও দ্বারা প্রতারণা রোধ করে।
গভীরতা সংবেদনশীল ক্যামেরা এম্বেডেড ভিশন ক্ষেত্রে একটি উল্লেখযোগ্য প্রযুক্তিগত অগ্রগতি প্রতিনিধিত্ব করে। যাইহোক, স্ট্রাকচার্ড লাইট, টাইম-অফ-ফ্লাইট বা বাইনোকুলার ভিশন—প্রতিটি প্রযুক্তিই ৩ডি ধারণার জন্য বিশিষ্ট সমাধান প্রদান করে। এই গভীরতা ক্যামেরা প্রকারগুলির নীতিগুলি ও বৈশিষ্ট্যগুলি বোঝা এবং প্রয়োগের পরিস্থিতি (যেমন রোবটিক্সের জন্য গভীরতা ক্যামেরা) অনুযায়ী সঠিকভাবে এগুলি নির্বাচন করা প্রতিটি মেশিন ভিশন ইঞ্জিনিয়ারের জন্য অপরিহার্য। গভীরতা ক্যামেরা মেশিনগুলিকে ত্রিমাত্রিক বিশ্বকে ধারণ করার ক্ষমতা প্রদান করে এবং স্বয়ংক্রিয়করণ থেকে বুদ্ধিমত্তার দিকে একটি গভীর রূপান্তর ঘটাচ্ছে।
আপনি কি আপনার প্রকল্পের জন্য সঠিক ডেপথ ক্যামেরা নির্বাচন করতে সমস্যায় ভোগছেন? আজই আমাদের বিশেষজ্ঞদের দলের সাথে যোগাযোগ করুন পেশাদার এম্বেডেড ভিশন এবং ৩ডি ধারণা সমাধান পরামর্শের জন্য, যা আপনার অ্যাপ্লিকেশনের জন্য সেরা মেশিন ভিশন সিস্টেম তৈরি করতে সাহায্য করবে।