از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
آموزش هوش مصنوعی برای برقراری ارتباط صداهایی شبیه به انسان است
چه در حال توصیف صدای موتور خودروی معیوب خود باشید و چه مانند گربه همسایهتان میومیو میکنید، تقلید صداها با صدای خود میتواند راه مفیدی برای انتقال مفهومی باشد، زمانی که کلمات کارساز نیستند.
تقلید صدا معادل صوتی ساختن یک عکس سریع برای برقراری ارتباط با چیزی است که دیدهاید – با این تفاوت که به جای استفاده از مداد برای نشان دادن یک تصویر، از دستگاه صوتی خود برای بیان یک صدا استفاده میکنید. این ممکن است دشوار به نظر برسد، اما کاری است که همه ما به طور شهودی انجام میدهیم: برای اینکه خودتان آن را تجربه کنید، سعی کنید از صدای خود برای بازتاب صدای آژیر آمبولانس، کلاغ یا زنگ در حال زدن استفاده کنید.
محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) با الهام از علم شناختی روش برقراری ارتباط ما، یک سیستم هوش مصنوعی ایجاد کرده اند که می تواند تقلیدهای صوتی شبیه انسان را بدون هیچ آموزشی و بدون اینکه قبلاً “شنیده” صدایی از انسان ایجاد کند، ایجاد کند. .
برای دستیابی به این هدف، محققان سیستم خود را طوری مهندسی کردند که صداهایی شبیه به ما تولید و تفسیر کند. آنها با ساختن مدلی از دستگاه صوتی انسان شروع کردند که روش شکل گیری ارتعاشات جعبه صدا توسط گلو، زبان و لب ها را شبیه سازی می کند. سپس، آنها از یک الگوریتم هوش مصنوعی الهام گرفته از شناختی برای کنترل این مدل دستگاه صوتی و ایجاد تقلید از آن استفاده کردند، با در نظر گرفتن روشهای خاص زمینه که انسان برای برقراری ارتباط صدا انتخاب میکند.
این مدل میتواند به طور موثر صداهای زیادی را از جهان بگیرد و تقلیدی شبیه انسان از آنها ایجاد کند – از جمله صداهایی مانند خشخش برگها، صدای خش خش مار و نزدیک شدن آژیر آمبولانس. مدل آنها همچنین میتواند به صورت معکوس اجرا شود تا صداهای دنیای واقعی را از تقلید صدای انسان حدس بزند، مشابه اینکه برخی از سیستمهای بینایی کامپیوتری میتوانند تصاویر با کیفیت بالا را بازیابی کنند. روی طرح ها به عنوان مثال، این مدل می تواند به درستی صدای تقلید یک انسان از «میو» گربه را در مقابل «هیس» آن تشخیص دهد.
در آینده، این مدل به طور بالقوه میتواند به رابطهای بصری «مبتنی بر تقلید» برای طراحان صدا، کاراکترهای هوش مصنوعی بیشتر شبیه انسان در واقعیت مجازی و حتی روشهایی برای کمک به دانشآموزان در یادگیری زبانهای جدید منجر شود.
نویسندگان همکار – دانشجویان دکترای MIT CSAIL، Kartik Chandra SM ’23 و Karima Ma، و محقق کارشناسی متیو کارن – خاطرنشان می کنند که محققان گرافیک کامپیوتری مدت هاست متوجه شده اند که واقع گرایی به ندرت هدف نهایی بیان بصری است. به عنوان مثال، یک نقاشی انتزاعی یا یک ابله مداد رنگی کودک می تواند به اندازه یک عکس گویا باشد.
چاندرا خاطرنشان میکند: «در چند دهه گذشته، پیشرفتها در الگوریتمهای طراحی منجر به ابزارهای جدیدی برای هنرمندان، پیشرفتهایی در هوش مصنوعی و بینایی رایانهای و حتی درک عمیقتر از شناخت انسان شده است. همانطور که یک طرح یک نمایش انتزاعی و غیر فوتورالیستی از یک تصویر است، روش ما انتزاعی و غیرآوا را به تصویر میکشد.–روش های واقع بینانه ای که انسان ها صداهایی را که می شنوند بیان می کنند. این به ما در مورد process انتزاع شنیداری.»
منبع: https://news.mit.edu/1404/teaching-ai-communicate-sounds-humans-do-0109
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1404-01-10 00:03:08