گامی مهم در توسعه بینایی ربات‌ها

دنیای ربات‌ها

گامی مهم در توسعه بینایی ربات‌ها

توسعه الگوریتم‌های بینایی ربات‌ها از موارد مهم برای محققان است. هنگامی که سیستم‌های هوش مصنوعی با صحنه‌هایی مواجه می‌شوند که در آن اشیا به‌طور کامل قابل مشاهده نیستند، باید فقط براساس قسمت‌های قابل‌مشاهده اشیا تخمین بزنند.

این اطلاعات جزئی به خطاهای تشخیص منجر می‌شود و داده‌های آموزشی زیادی برای تشخیص صحیح چنین صحنه‌هایی مورد نیاز است. اکنون محققان موسسه علم و فناوری گوانگجو چارچوبی ایجاد کرده‌اند که به ربات اجازه می‌دهد چنین اشیایی را به همان روشی که ما آنها را درک می‌کنیم، با موفقیت شناسایی کند.

بینایی رباتیک راه درازی را پیموده است و به سطحی از پیچیدگی با برنامه‌های کاربردی در کارهای پیچیده و سخت، مانند رانندگی مستقل و ... رسیده است. بااین‌حال، هنوز برای شناسایی اشیای منفرد در صحنه‌های شلوغ که برخی از اشیا به‌طور جزئی یا کامل در پشت دیگران پنهان شده‌اند، تلاش می‌کند. به‌طورمعمول، هنگام برخورد با چنین صحنه‌هایی، سیستم‌های بینایی رباتیک برای شناسایی جسم مسدودشده فقط براساس قسمت‌های قابل‌مشاهده آن آموزش داده می‌شود اما چنین آموزشی به مجموعه داده‌های بزرگی از شکل اشیا نیاز دارد و می‌تواند بسیار خسته‌کننده باشد.

موسسه علم و فناوری گوانگجو (GIST) در کشور کره‌جنوبی زمانی که در حال توسعه یک سامانه هوش مصنوعی برای شناسایی و مرتب‌سازی اشیا در صحنه‌های شلوغ بود، با این مشکل مواجه شد. ما از یک ربات انتظار داریم اشیایی را که قبلا با آنها برخورد نکرده‌اند شناسایی و به‌طورمثال جابه‌جا کنند. بااین‌حال، در واقعیت، باید داده‌ها را به‌صورت دستی جمع‌آوری و به سامانه معرفی کنیم.

در یک مطالعه جدید که در کنفرانس بین‌المللی رباتیک و اتوماسیون در سال 2022 پذیرفته شده است محققان این مرکز با ایجاد بانک اطلاعاتی شامل 45هزار تصویر، سیستمی مبتنی بر یادگیری عمیق ایجاد کرده‌اند که قابلیت تشخیصی بسیار دقیقی به‌خصوص برای شناسایی اجسامی دارد که بخشی از آنها در پشت جسم دیگری پنهان شده است.

محققان از نتایج هیجان‌زده شدند. در درجه اول تعداد عکس‌ها برای این‌که این سیستم یاد بگیرد بسیار کم است. از طرف دیگر، روش‌های قبلی به تشخیص فقط انواع خاصی از اشیا یا تشخیص فقط مناطق قابل‌مشاهده بدون استدلال صریح روی مناطق مسدود محدود می‌شد. در مقابل، روش جدید می‌تواند مناطق پنهان در پشت اجسام را مانند سیستم بینایی انسان استنتاج کند. این الگوریتم موجب کاهش تلاش برای جمع‌آوری داده‌ها می‌شود درحالی‌که عملکرد را در یک محیط پیچیده بهبود بخشیده است.

سیستم بینایی و تصمیم‌گیری انسان می‌تواند با دیدن بخشی از یک جسم که در پشت جسم دیگری پنهان شده است آن جسم را با دقت خوبی شناسایی کند اما برای سیستم بینایی مصنوعی چنین نیست. این سیستم‌ها باید با آموزش دیدن قادر به شناسایی اجسام شوند، برای آموزش به حجم بسیار بالایی از اطلاعات تصویری از اجسام مختلف نیاز است. حال اگر در یک محیط مانند یک اتاق کار قرار بگیرند با تعداد زیادی از اجسامی روبه‌رو خواهند شد که تنها بخشی از آنها مشخص است و تصمیم‌گیری و شناسایی برای یک ربات در چنین محیطی بسیار پیچیده است.

از نظر من این مقاله جدید بسیار امیدوارکننده و خاص است و در مسأله شناسایی اجسام مسدودشده در محیط‌های پیچیده و واقعی، نوعی خط‌شکنی قلمداد می‌شود. این الگوریتم نوین امیدهای بسیاری در محققان برای توسعه ربات‌های کاربردی که بتوانند در محیط‌های نزدیک به انسان کار کنند به وجود آورده است.

آریا صبوری - پژوهشگر مقطع دکتری در دانشگاه مدیترانه شرقی