دنیای رباتها
گامی مهم در توسعه بینایی رباتها
توسعه الگوریتمهای بینایی رباتها از موارد مهم برای محققان است. هنگامی که سیستمهای هوش مصنوعی با صحنههایی مواجه میشوند که در آن اشیا بهطور کامل قابل مشاهده نیستند، باید فقط براساس قسمتهای قابلمشاهده اشیا تخمین بزنند.
این اطلاعات جزئی به خطاهای تشخیص منجر میشود و دادههای آموزشی زیادی برای تشخیص صحیح چنین صحنههایی مورد نیاز است. اکنون محققان موسسه علم و فناوری گوانگجو چارچوبی ایجاد کردهاند که به ربات اجازه میدهد چنین اشیایی را به همان روشی که ما آنها را درک میکنیم، با موفقیت شناسایی کند.
بینایی رباتیک راه درازی را پیموده است و به سطحی از پیچیدگی با برنامههای کاربردی در کارهای پیچیده و سخت، مانند رانندگی مستقل و ... رسیده است. بااینحال، هنوز برای شناسایی اشیای منفرد در صحنههای شلوغ که برخی از اشیا بهطور جزئی یا کامل در پشت دیگران پنهان شدهاند، تلاش میکند. بهطورمعمول، هنگام برخورد با چنین صحنههایی، سیستمهای بینایی رباتیک برای شناسایی جسم مسدودشده فقط براساس قسمتهای قابلمشاهده آن آموزش داده میشود اما چنین آموزشی به مجموعه دادههای بزرگی از شکل اشیا نیاز دارد و میتواند بسیار خستهکننده باشد.
موسسه علم و فناوری گوانگجو (GIST) در کشور کرهجنوبی زمانی که در حال توسعه یک سامانه هوش مصنوعی برای شناسایی و مرتبسازی اشیا در صحنههای شلوغ بود، با این مشکل مواجه شد. ما از یک ربات انتظار داریم اشیایی را که قبلا با آنها برخورد نکردهاند شناسایی و بهطورمثال جابهجا کنند. بااینحال، در واقعیت، باید دادهها را بهصورت دستی جمعآوری و به سامانه معرفی کنیم.
در یک مطالعه جدید که در کنفرانس بینالمللی رباتیک و اتوماسیون در سال 2022 پذیرفته شده است محققان این مرکز با ایجاد بانک اطلاعاتی شامل 45هزار تصویر، سیستمی مبتنی بر یادگیری عمیق ایجاد کردهاند که قابلیت تشخیصی بسیار دقیقی بهخصوص برای شناسایی اجسامی دارد که بخشی از آنها در پشت جسم دیگری پنهان شده است.
محققان از نتایج هیجانزده شدند. در درجه اول تعداد عکسها برای اینکه این سیستم یاد بگیرد بسیار کم است. از طرف دیگر، روشهای قبلی به تشخیص فقط انواع خاصی از اشیا یا تشخیص فقط مناطق قابلمشاهده بدون استدلال صریح روی مناطق مسدود محدود میشد. در مقابل، روش جدید میتواند مناطق پنهان در پشت اجسام را مانند سیستم بینایی انسان استنتاج کند. این الگوریتم موجب کاهش تلاش برای جمعآوری دادهها میشود درحالیکه عملکرد را در یک محیط پیچیده بهبود بخشیده است.
سیستم بینایی و تصمیمگیری انسان میتواند با دیدن بخشی از یک جسم که در پشت جسم دیگری پنهان شده است آن جسم را با دقت خوبی شناسایی کند اما برای سیستم بینایی مصنوعی چنین نیست. این سیستمها باید با آموزش دیدن قادر به شناسایی اجسام شوند، برای آموزش به حجم بسیار بالایی از اطلاعات تصویری از اجسام مختلف نیاز است. حال اگر در یک محیط مانند یک اتاق کار قرار بگیرند با تعداد زیادی از اجسامی روبهرو خواهند شد که تنها بخشی از آنها مشخص است و تصمیمگیری و شناسایی برای یک ربات در چنین محیطی بسیار پیچیده است.
از نظر من این مقاله جدید بسیار امیدوارکننده و خاص است و در مسأله شناسایی اجسام مسدودشده در محیطهای پیچیده و واقعی، نوعی خطشکنی قلمداد میشود. این الگوریتم نوین امیدهای بسیاری در محققان برای توسعه رباتهای کاربردی که بتوانند در محیطهای نزدیک به انسان کار کنند به وجود آورده است.
آریا صبوری - پژوهشگر مقطع دکتری در دانشگاه مدیترانه شرقی
بینایی رباتیک راه درازی را پیموده است و به سطحی از پیچیدگی با برنامههای کاربردی در کارهای پیچیده و سخت، مانند رانندگی مستقل و ... رسیده است. بااینحال، هنوز برای شناسایی اشیای منفرد در صحنههای شلوغ که برخی از اشیا بهطور جزئی یا کامل در پشت دیگران پنهان شدهاند، تلاش میکند. بهطورمعمول، هنگام برخورد با چنین صحنههایی، سیستمهای بینایی رباتیک برای شناسایی جسم مسدودشده فقط براساس قسمتهای قابلمشاهده آن آموزش داده میشود اما چنین آموزشی به مجموعه دادههای بزرگی از شکل اشیا نیاز دارد و میتواند بسیار خستهکننده باشد.
موسسه علم و فناوری گوانگجو (GIST) در کشور کرهجنوبی زمانی که در حال توسعه یک سامانه هوش مصنوعی برای شناسایی و مرتبسازی اشیا در صحنههای شلوغ بود، با این مشکل مواجه شد. ما از یک ربات انتظار داریم اشیایی را که قبلا با آنها برخورد نکردهاند شناسایی و بهطورمثال جابهجا کنند. بااینحال، در واقعیت، باید دادهها را بهصورت دستی جمعآوری و به سامانه معرفی کنیم.
در یک مطالعه جدید که در کنفرانس بینالمللی رباتیک و اتوماسیون در سال 2022 پذیرفته شده است محققان این مرکز با ایجاد بانک اطلاعاتی شامل 45هزار تصویر، سیستمی مبتنی بر یادگیری عمیق ایجاد کردهاند که قابلیت تشخیصی بسیار دقیقی بهخصوص برای شناسایی اجسامی دارد که بخشی از آنها در پشت جسم دیگری پنهان شده است.
محققان از نتایج هیجانزده شدند. در درجه اول تعداد عکسها برای اینکه این سیستم یاد بگیرد بسیار کم است. از طرف دیگر، روشهای قبلی به تشخیص فقط انواع خاصی از اشیا یا تشخیص فقط مناطق قابلمشاهده بدون استدلال صریح روی مناطق مسدود محدود میشد. در مقابل، روش جدید میتواند مناطق پنهان در پشت اجسام را مانند سیستم بینایی انسان استنتاج کند. این الگوریتم موجب کاهش تلاش برای جمعآوری دادهها میشود درحالیکه عملکرد را در یک محیط پیچیده بهبود بخشیده است.
سیستم بینایی و تصمیمگیری انسان میتواند با دیدن بخشی از یک جسم که در پشت جسم دیگری پنهان شده است آن جسم را با دقت خوبی شناسایی کند اما برای سیستم بینایی مصنوعی چنین نیست. این سیستمها باید با آموزش دیدن قادر به شناسایی اجسام شوند، برای آموزش به حجم بسیار بالایی از اطلاعات تصویری از اجسام مختلف نیاز است. حال اگر در یک محیط مانند یک اتاق کار قرار بگیرند با تعداد زیادی از اجسامی روبهرو خواهند شد که تنها بخشی از آنها مشخص است و تصمیمگیری و شناسایی برای یک ربات در چنین محیطی بسیار پیچیده است.
از نظر من این مقاله جدید بسیار امیدوارکننده و خاص است و در مسأله شناسایی اجسام مسدودشده در محیطهای پیچیده و واقعی، نوعی خطشکنی قلمداد میشود. این الگوریتم نوین امیدهای بسیاری در محققان برای توسعه رباتهای کاربردی که بتوانند در محیطهای نزدیک به انسان کار کنند به وجود آورده است.
آریا صبوری - پژوهشگر مقطع دکتری در دانشگاه مدیترانه شرقی