رباتی که با دقت بینظیر «جنگا» بازی میکند
یک روش جدید مبتنی بر هوش مصنوعی که در دانشگاه کالیفرنیا برکلی (UC Berkeley) توسعه یافته است، متشکل از ترکیبی از یادگیری تقویتی و آموزش انسانی برای کمک به رباتها برای تسلط سریع و کارآمد بر وظایف است.
به گزارش نیوزلند، محققان دانشگاه کالیفرنیا در برکلی روش جدیدی را برای آموزش به رباتها ایجاد کردهاند که به آنها کمک میکند مهارتهایی مانند بازی کردن جنگا یا چیدن آن را با سرعت و دقت به دست آورند. این روش جدید با ترکیب ترکیبی از هوش مصنوعی (AI)، یادگیری تقویتی و راهنمایی انسان، به رباتها اجازه میدهد تنها در چند ساعت از یک مبتدی به یک متخصص تبدیل شوند.
به نقل از آیای، گروه آزمایشگاه هوش مصنوعی و یادگیری رباتیک سرگی لوین (Sergey Levine)، یک روش یادگیری جدید برای کمک به رباتها ایجاد کردند که باعث میشود رباتها اصول یک کار را یاد بگیرند و سپس با تمرین در دنیای واقعی در آن بهبود پیدا کنند. همانطور که انسانها از طریق آزمون و خطا یاد میگیرند، روش یادگیری تقویتی، ربات را قادر میسازد تا از حسگرها و دوربینها بازخورد بگیرد تا بفهمد کجاها خوب عمل میکند و نقاطی که در آنها شکست میخورد را بشناسد.
این روش جدید آموزش ربات همچنین شامل راهنماییهای انسانی برای اصلاح بیشتر مهارتهای یک ربات در هنگام انجام یک کار است. با استفاده از این روش، مربی انسانی میتواند از یک ماوس مخصوص برای اصلاح حرکات ربات در صورت انجام کار اشتباه استفاده کند.
این ورودی به حافظه ربات وارد میشود تا به اصلاح مدل آن برای تکمیل یک کار کمک کند. با استفاده از این دادهها و موفقیتها و شکستهای آن، روش جدید یادگیری هوش مصنوعی به طور چشمگیری سرعت یادگیری و دقت ربات را در انجام یک کار بهبود میبخشد.
تبدیل شدن به یک استاد در عرض چند ساعت
جیانلان لو (Jianlan Luo) که بخشی از تیم تحقیقاتی است، با بیان این که این ربات به مداخله انسانی کمتری نیاز دارد و از تجربه آموزش میبیند، اضافه کرد: شاید برای ۳۰ درصد اول کار نیاز باشد که از ربات مراقبت کنیم؛ اما به تدریج میتوانیم توجه کمتری به آن داشته باشیم.
این تیم برای آزمایش روش یادگیری جدید خود، سیستم رباتیک خود را تحت وظایف مختلف نامرتبطی قرار دادند. اولین مورد برداشتن مهرههای بازی «جنگا» بود که شامل استفاده از یک طناب کوتاه برای «ضربه زدن» به بلوکهای جنگا میشد.
سایر وظایف عبارتند از چرخاندن تخم مرغ در ماهیتابه، انتقال یک جسم از یک بازو به بازوی دیگر، مونتاژ مادربرد از ابتدا، مونتاژ داشبورد ماشین و تعویض تسمه تایم موتور.
این وظایف به دلیل تفاوت قابل توجهی بین مهارت و کارکرد انتخاب شدند و تیم بر این باورند که آنها اکثر وظایف اصلی را که میتوان انتظار داشت یک ربات در دنیای واقعی انجام دهد را پوشش دادند.
از میان کارهایی که ربات انجام داد، تعویض تسمه تایم بسیار دشوار بود. با توجه به ماهیت کار و مواد درگیر، ربات باید واکنش نشان میداد و متغیرهای زیادی را پیشبینی میکرد که در هر بار انجام کار متفاوت بود.
یادگیری تقویتی بسیار مهم است
برداشتن با یک ضربه مهرههای جنگا یکی دیگر از تلاشهای جالب برای تیم بود، زیرا مدلسازی فیزیک درگیر در انجام آن بسیار دشوار است. این کار برای همه به جز ماهرترین بازیکنان سخت است و برای ربات این کار یک چالش واقعی بود.
در این مورد، آموزش در دنیای واقعی بسیار مهم بود تا ربات بتواند از طریق تجربه به جای آموزش صرفا شبیهسازی شده، یاد بگیرد. با این حال، پس از استفاده از روش جدید یادگیری، ربات میتواند این کار را با موفقیت ۱۰۰ درصد به خوبی انجام دهد.
این تیم همچنین با ایجاد حرکات در طول کار، وظایف ربات را سختتر کردند. این شامل حرکت مادربرد در حین مونتاژ برای وادار کردن ربات به واکنش سریع در یک محیط پویا و غیرقابل پیشبینی بود.
با وجود همه اینها، ربات میتواند تمام وظایف را با دقت ۱۰۰ درصد و سریعتر از آموزش سنتی انجام دهد. با حرکت رو به جلو، محققان اکنون امیدوارند زمان آموزش را کاهش دهند.
آنها همچنین قصد دارند تحقیقات خود را منبع باز کنند تا به سایر دانشمندان کمک کنند تا پروژههای خود را اصلاح کنند و بر اساس آنها بسازند.
انتهای پیام
منبع:www.isna.ir