وبلاگ رسانگار
با ما حرفه ای باشید

سرور مجازی NVMe

یاور رباتیک اشتباه می کند؟ فقط آن را در جهت درست گول بزنید

0 0
زمان لازم برای مطالعه: 5 دقیقه


تصور کنید که یک ربات به شما در تمیز کردن ظروف کمک می کند. شما از آن می خواهید که یک کاسه صابون را از سینک خارج کنید ، اما چنگال آن کمی علامت را از دست می دهد.

با استفاده از یک چارچوب جدید که توسط محققان MIT و NVIDIA تهیه شده است ، می توانید رفتار ربات را با تعامل ساده تصحیح کنید. این روش به شما امکان می دهد تا به کاسه اشاره کنید یا یک مسیر را به آن ردیابی کنید روی یک صفحه نمایش ، یا به سادگی بازوی ربات را در جهت درست قرار دهید.

بر خلاف سایر روشها برای تصحیح رفتار ربات ، این تکنیک نیازی به کاربران ندارد تا داده های جدید را جمع آوری کرده و مدل یادگیری ماشین را که مغز ربات را قدرت می دهد ، بازیابی کنند. این یک ربات را قادر می سازد تا از بازخورد بصری و واقعی انسانی استفاده کند تا یک توالی عملی عملی را انتخاب کند که تا حد امکان برای رضایت از هدف کاربر نزدیک شود.

هنگامی که محققان چارچوب خود را آزمایش کردند ، میزان موفقیت آن 21 درصد بیشتر از یک روش جایگزین بود که از مداخلات انسانی استفاده نمی کرد.

در طولانی مدت ، این چارچوب می تواند کاربر را قادر سازد که به راحتی یک روبات آموزش دیده کارخانه را راهنمایی کند تا طیف گسترده ای از کارهای خانگی را انجام دهد ، حتی اگر این روبات هرگز خانه خود یا اشیاء موجود در آن را ندیده باشد.

وی گفت: “ما نمی توانیم انتظار داشته باشیم که افراد Laypeople جمع آوری داده ها را انجام دهند و یک مدل شبکه عصبی را تنظیم کنند. مصرف کننده انتظار دارد که روبات درست از جعبه خارج شود و اگر این کار را نکند ، آنها می خواهند یک مکانیسم شهودی برای سفارشی کردن آن داشته باشند. این چالشی است که ما در این کار با آن روبرو شدیم. ” روی این روش

نویسندگان وی شامل دکترا لیرووی وانگ ’24 و Yilun du Phd ’24 هستند. جولی شاه ، نویسنده ارشد ، استاد MIT از هوانوردی و فضانوردی و مدیر گروه رباتیک تعاملی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) ؛ و همچنین Balakumar Sundaralingam ، Xuning Yang ، Yu-Wei Chao ، Claudia Perez-D’Arpino PhD ’19 و Dieter Fox Nvidia. این تحقیق در کنفرانس بین المللی ارائه خواهد شد روی روبات ها و اتوماسیون.

کاهش نادرست

به تازگی ، محققان با استفاده از مدل های پیش از آموزش تولید شده برای یادگیری “خط مشی” یا مجموعه ای از قوانین ، که یک ربات برای انجام یک عمل دنبال می کند ، استفاده کرده اند. مدل های تولیدی می توانند چندین کار پیچیده را حل کنند.

پیشنهاد می‌کنیم بخوانید:  تراز کردن هوش مصنوعی با ارزشهای انسانی

در طول آموزش ، این مدل فقط حرکات ربات امکان پذیر را می بیند ، بنابراین می آموزد که مسیرهای معتبر را برای دنبال کردن ربات ایجاد کند.

در حالی که این مسیرها معتبر هستند ، این بدان معنی نیست که آنها همیشه با هدف کاربر در دنیای واقعی هماهنگ هستند. این روبات ممکن است آموزش داده شود تا بدون اینکه آنها را بکشد ، جعبه ها را از قفسه خارج کند ، اما می تواند نتواند به جعبه برسد روی اگر قفسه متفاوت از آنچه در آموزش دید ، در بالای قفسه کتاب شخصی قرار دارد.

برای غلبه بر این خرابی ها ، مهندسان به طور معمول داده هایی را نشان می دهند که وظیفه جدید را نشان می دهند و مدل تولیدی را دوباره هدایت می کنند ، یک پرهزینه و وقت گیر process این نیاز به تخصص یادگیری ماشین دارد.

درعوض ، محققان MIT می خواستند به کاربران اجازه دهند تا در هنگام استقرار ، رفتار ربات را هدایت کنند.

اما اگر یک انسان برای اصلاح رفتار خود با ربات در تعامل باشد ، این می تواند سهواً باعث شود مدل تولیدی یک عمل نامعتبر را انتخاب کند. این ممکن است به جعبه ای که کاربر می خواهد برسد ، اما کتاب های موجود در قفسه را در آن قرار می دهد processبشر

وانگ می گوید: “ما می خواهیم به کاربر اجازه دهیم بدون اینکه این نوع اشتباهات را معرفی کند ، با ربات ارتباط برقرار کند ، بنابراین رفتاری می گیریم که در هنگام استقرار بسیار بیشتر با هدف کاربر مطابقت داشته باشد ، اما این نیز معتبر و امکان پذیر است.”

چارچوب آنها با ارائه سه روش بصری برای اصلاح رفتار ربات ، این کار را انجام می دهد که هر یک از آنها مزایای خاصی را ارائه می دهد.

ابتدا کاربر می تواند به شیء مورد نظر خود اشاره کند که ربات در رابط کاربری که نمای دوربین خود را نشان می دهد ، دستکاری کند. دوم ، آنها می توانند یک مسیر را در آن رابط ردیابی کنند و به آنها اجازه می دهند تا مشخص کنند که چگونه می خواهند ربات به شیء برسد. سوم ، آنها می توانند از نظر جسمی بازوی ربات را به مسیری که می خواهند دنبال کنند ، حرکت دهند.

وی گفت: “هنگامی که شما در حال نقشه برداری از یک تصویر 2D از محیط به اقدامات در یک فضای سه بعدی هستید ، برخی از اطلاعات از بین می روند. فریب دادن جسمی روبات مستقیم ترین راه برای تعیین قصد کاربر بدون از دست دادن هیچ یک از اطلاعات است. “

پیشنهاد می‌کنیم بخوانید:  آموزش هوش مصنوعی برای برقراری ارتباط صداهایی شبیه به انسان است

نمونه برداری برای موفقیت

محققان برای اطمینان از این فعل و انفعالات باعث نمی شوند که ربات یک اقدام نامعتبر مانند برخورد با اشیاء دیگر انتخاب کند ، محققان از یک روش نمونه گیری خاص استفاده می کنند. این تکنیک به مدل اجازه می دهد تا از مجموعه اقدامات معتبر که بیشتر با هدف کاربر هماهنگ است ، عملی را انتخاب کند.

وانگ توضیح می دهد: “به جای اینکه فقط اراده کاربر را تحمیل کنیم ، ما به روبات ایده ای از آنچه کاربر در نظر دارد ، می دهیم اما اجازه می دهیم روش نمونه گیری در مورد مجموعه رفتارهای آموخته شده خود نوسان کند.”

این روش نمونه برداری به چارچوب محققان این امکان را می دهد تا از سایر روش هایی که آنها در طول شبیه سازی ها و آزمایش ها با یک بازوی روبات واقعی در یک آشپزخانه اسباب بازی مقایسه می کنند ، بهتر عمل کنند.

در حالی که روش آنها ممکن است همیشه کار را بلافاصله انجام ندهد ، این مزیت را به کاربران می دهد که بتوانند فوراً ربات را اصلاح کنند اگر می بینند که این کار را اشتباه انجام می دهد ، به جای اینکه منتظر بماند تا آن را تمام کند و سپس دستورالعمل های جدیدی را ارائه دهد.

علاوه بر این ، بعد از اینکه کاربر چند بار ربات را تا زمانی که کاسه صحیح را انتخاب کند ، می تواند آن عمل اصلاحی را وارد کند و از طریق آموزش های آینده آن را در رفتار خود گنجانید. سپس ، روز بعد ، ربات می تواند بدون نیاز به گنگ ، کاسه صحیح را انتخاب کند.

وانگ می گوید: “اما نکته اصلی این پیشرفت مستمر داشتن راهی برای تعامل کاربر با ربات است ، این همان چیزی است که ما در اینجا نشان داده ایم.”

در آینده ، محققان می خواهند ضمن حفظ یا بهبود عملکرد آن ، سرعت روش نمونه برداری را تقویت کنند. آنها همچنین می خواهند با تولید سیاست ربات در محیط های جدید آزمایش کنند.


منبع: https://news.mit.edu/1404/robotic-helper-mistakes-nudging-in-right-direction-0307

برای نگارش بخشهایی از این متن ممکن است از ترجمه ماشینی یا هوش مصنوعی GPT استفاده شده باشد
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم

زمان انتشار: 1404-03-08 18:08:11

امتیاز شما به این مطلب
دیدگاه شما در خصوص مطلب چیست ؟

آدرس ایمیل شما منتشر نخواهد شد.

لطفا دیدگاه خود را با احترام به دیدگاه های دیگران و با توجه به محتوای مطلب درج کنید