از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
ایجاد و تأیید سیستم های پایدار کنترل شده با هوش مصنوعی به روشی دقیق و انعطاف پذیر
شبکه های عصبی تاثیر لرزه ای ایجاد کرده اند روی چگونه مهندسان کنترل کننده هایی را برای روبات ها طراحی می کنند و ماشین های سازگارتر و کارآمدتر را تسریع می کنند. با این حال، این سیستمهای یادگیری ماشینی مغز مانند یک شمشیر دولبه هستند: پیچیدگی آنها آنها را قدرتمند میکند، اما همچنین تضمین این که رباتی که توسط یک شبکه عصبی کار میکند، به طور ایمن وظیفه خود را انجام میدهد، دشوار است.
روش سنتی برای تأیید ایمنی و پایداری از طریق تکنیک هایی به نام توابع لیاپانوف است. اگر بتوانید تابع لیاپانوف را پیدا کنید که مقدار آن به طور مداوم کاهش می یابد، می توانید بدانید که موقعیت های ناامن یا ناپایدار مرتبط با مقادیر بالاتر هرگز اتفاق نمی افتد. با این حال، برای روباتهایی که توسط شبکههای عصبی کنترل میشوند، رویکردهای قبلی برای تأیید شرایط لیاپانوف به خوبی برای ماشینهای پیچیده قابل مقایسه نبود.
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) و جاهای دیگر اکنون تکنیکهای جدیدی را توسعه دادهاند که محاسبات لیاپانوف را در سیستمهای دقیقتر تأیید میکند. الگوریتم آنها به طور موثر یک تابع لیاپانوف را جستجو و تأیید می کند و تضمین پایداری سیستم را ارائه می دهد. این رویکرد به طور بالقوه میتواند استقرار ایمنتر رباتها و وسایل نقلیه خودران، از جمله هواپیما و فضاپیما را امکانپذیر کند.
برای پیشی گرفتن از الگوریتمهای قبلی، محققان میانبری مقرون به صرفه برای آموزش و تأیید پیدا کردند process. آنها نمونههای متقابل ارزانتری تولید کردند – به عنوان مثال، دادههای متخاصم از حسگرهایی که میتوانستند کنترلکننده را پرتاب کنند – و سپس سیستم روباتیک را برای محاسبه آنها بهینهسازی کردند. درک این موارد لبه به ماشین ها کمک کرد تا یاد بگیرند که چگونه با شرایط چالش برانگیز کنار بیایند، که آنها را قادر می ساخت تا با خیال راحت در طیف وسیع تری از شرایط نسبت به گذشته کار کنند. سپس، آنها یک فرمول تأیید جدید را توسعه دادند که استفاده از تأییدکننده شبکه عصبی مقیاسپذیر، α، β-CROWN را برای ارائه ضمانتهای سختگیرانه بدترین سناریو فراتر از نمونههای متقابل، امکانپذیر میسازد.
لوجی یانگ، مهندسی برق و علوم کامپیوتر MIT (EECS) میگوید: «ما عملکردهای تجربی چشمگیری را در ماشینهای کنترلشده با هوش مصنوعی مانند انساننماها و سگهای رباتیک دیدهایم، اما این کنترلکنندههای هوش مصنوعی فاقد ضمانتهای رسمی هستند که برای سیستمهای حیاتی ایمنی حیاتی هستند». ) دانشجوی دکترا و وابسته به CSAIL که یکی از نویسندگان ارشد مقاله جدید است روی این پروژه در کنار محقق موسسه تحقیقاتی تویوتا، هونگکای دای SM ’12، دکترای ’16. یانگ میگوید: «کار ما شکاف بین آن سطح از عملکرد کنترلکنندههای شبکه عصبی و تضمینهای ایمنی مورد نیاز برای استقرار کنترلکنندههای شبکه عصبی پیچیدهتر را در دنیای واقعی پر میکند».
برای یک نمایش دیجیتال، تیم شبیهسازی کرد که چگونه یک پهپاد کوادروتور با حسگرهای لیدار در یک محیط دو بعدی تثبیت میشود. الگوریتم آنها تنها با استفاده از اطلاعات محدود محیطی ارائه شده توسط حسگرهای لیدار، پهپاد را با موفقیت به موقعیت شناور پایدار هدایت کرد. در دو آزمایش دیگر، رویکرد آنها عملکرد پایدار دو سیستم رباتیک شبیهسازیشده را در محدوده وسیعتری از شرایط ممکن کرد: یک آونگ معکوس و یک وسیله نقلیه ردیابی مسیر. این آزمایشها، اگرچه ساده هستند، اما نسبتاً پیچیدهتر از آن چیزی هستند که جامعه تأیید شبکه عصبی قبلاً میتوانست انجام دهد، به ویژه به این دلیل که شامل مدلهای حسگر میشد.
سیکون گائو، دانشیار علوم و مهندسی کامپیوتر در دانشگاه کالیفرنیا در سان میگوید: «برخلاف مشکلات رایج یادگیری ماشین، استفاده دقیق از شبکههای عصبی به عنوان توابع لیاپانوف نیازمند حل مسائل سخت بهینهسازی جهانی است و بنابراین مقیاسپذیری گلوگاه کلیدی است. دیگو که در این کار دخالتی نداشت. کار فعلی با توسعه رویکردهای الگوریتمی که برای استفاده خاص از شبکههای عصبی بهعنوان توابع لیاپانوف در مسائل کنترلی مناسبتر هستند، سهم مهمی دارد. به بهبود قابل توجهی در مقیاس پذیری و کیفیت راه حل ها نسبت به رویکردهای موجود دست می یابد. این کار مسیرهای هیجان انگیزی را برای توسعه بیشتر الگوریتم های بهینه سازی برای روش های عصبی لیاپانوف و استفاده دقیق از یادگیری عمیق در کنترل و به طور کلی روباتیک باز می کند.
رویکرد پایداری یانگ و همکارانش کاربردهای بالقوه وسیعی دارد که در آن تضمین ایمنی بسیار مهم است. این می تواند به اطمینان از رانندگی نرم تر برای وسایل نقلیه خودران مانند هواپیما و فضاپیما کمک کند. به همین ترتیب، پهپادی که اقلام را تحویل میدهد یا زمینهای مختلف را نقشهبرداری میکند، میتواند از چنین تضمینهای ایمنی بهرهمند شود.
تکنیک های توسعه یافته در اینجا بسیار کلی هستند و فقط مختص رباتیک نیستند. همین تکنیکها به طور بالقوه میتوانند به کاربردهای دیگر، مانند زیستپزشکی و پردازش صنعتی، در آینده کمک کنند.
در حالی که این تکنیک از نظر مقیاس پذیری ارتقاء یافته از کارهای قبلی است، محققان در حال بررسی چگونگی عملکرد بهتر آن در سیستم هایی با ابعاد بالاتر هستند. آنها همچنین میخواهند دادههای فراتر از خوانشهای لیدار، مانند تصاویر و ابرهای نقطهای را نیز در نظر بگیرند.
به عنوان یک مسیر تحقیقاتی آینده، تیم مایل است تضمین های پایداری مشابهی را برای سیستم هایی که در محیط های نامشخص و در معرض اختلال هستند ارائه دهد. به عنوان مثال، اگر یک پهپاد با وزش شدید باد مواجه شود، یانگ و همکارانش میخواهند مطمئن شوند که همچنان به طور پیوسته پرواز میکند و کار مورد نظر را تکمیل میکند.
همچنین، آنها قصد دارند روش خود را برای مسائل بهینهسازی به کار ببرند، جایی که هدف به حداقل رساندن زمان و مسافتی است که یک ربات برای تکمیل یک کار نیاز دارد و در عین حال ثابت است. آنها قصد دارند تکنیک خود را به انسان نماها و سایر ماشین های دنیای واقعی گسترش دهند، جایی که یک ربات باید در حین برقراری تماس با محیط اطراف خود پایدار بماند.
راس تدریک، استاد تویوتا EECS، هوانوردی و فضانوردی، و مهندسی مکانیک در MIT، معاون تحقیقات روباتیک در TRI، و عضو CSAIL، نویسنده ارشد این تحقیق است. این مقاله همچنین به دانشجوی دکترای دانشگاه کالیفرنیا در لس آنجلس، ژوکسینگ شی و دانشیار، چو جوئی هسیه، و همچنین استادیار دانشگاه ایلینوی اوربانا-شامپین، هوان ژانگ، اعتبار می دهد. کار آنها تا حدی توسط آمازون، بنیاد ملی علوم، دفتر تحقیقات نیروی دریایی و برنامه AI2050 در Schmidt Sciences پشتیبانی شد. مقاله محققان در کنفرانس بین المللی 1403 ارائه خواهد شد روی فراگیری ماشین.
منبع: https://news.mit.edu/1403/creating-verifying-stable-ai-controlled-systems-rigorous-flexible-way-0717
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1403-07-18 07:46:05