سرور مجازی NVMe

آموزش هوش مصنوعی برای برقراری ارتباط صداهایی شبیه به انسان است

توسط مهران در دی 21, 1403

آموزش هوش مصنوعی برای برقراری ارتباط صداهایی شبیه به انسان است

زمان لازم برای مطالعه: 2 دقیقه

چه در حال توصیف صدای موتور خودروی معیوب خود باشید و چه مانند گربه همسایه‌تان میومیو می‌کنید، تقلید صداها با صدای خود می‌تواند راه مفیدی برای انتقال مفهومی باشد، زمانی که کلمات کارساز نیستند.

تقلید صدا معادل صوتی ساختن یک عکس سریع برای برقراری ارتباط با چیزی است که دیده‌اید – با این تفاوت که به جای استفاده از مداد برای نشان دادن یک تصویر، از دستگاه صوتی خود برای بیان یک صدا استفاده می‌کنید. این ممکن است دشوار به نظر برسد، اما کاری است که همه ما به طور شهودی انجام می‌دهیم: برای اینکه خودتان آن را تجربه کنید، سعی کنید از صدای خود برای بازتاب صدای آژیر آمبولانس، کلاغ یا زنگ در حال زدن استفاده کنید.

محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) با الهام از علم شناختی روش برقراری ارتباط ما، یک سیستم هوش مصنوعی ایجاد کرده اند که می تواند تقلیدهای صوتی شبیه انسان را بدون هیچ آموزشی و بدون اینکه قبلاً “شنیده” صدایی از انسان ایجاد کند، ایجاد کند. .

برای دستیابی به این هدف، محققان سیستم خود را طوری مهندسی کردند که صداهایی شبیه به ما تولید و تفسیر کند. آنها با ساختن مدلی از دستگاه صوتی انسان شروع کردند که روش شکل گیری ارتعاشات جعبه صدا توسط گلو، زبان و لب ها را شبیه سازی می کند. سپس، آنها از یک الگوریتم هوش مصنوعی الهام گرفته از شناختی برای کنترل این مدل دستگاه صوتی و ایجاد تقلید از آن استفاده کردند، با در نظر گرفتن روش‌های خاص زمینه که انسان برای برقراری ارتباط صدا انتخاب می‌کند.

پیشنهاد می‌کنیم بخوانید: MAD Design Fellows 1403 اعلام شد

این مدل می‌تواند به طور موثر صداهای زیادی را از جهان بگیرد و تقلیدی شبیه انسان از آنها ایجاد کند – از جمله صداهایی مانند خش‌خش برگ‌ها، صدای خش خش مار و نزدیک شدن آژیر آمبولانس. مدل آن‌ها همچنین می‌تواند به صورت معکوس اجرا شود تا صداهای دنیای واقعی را از تقلید صدای انسان حدس بزند، مشابه اینکه برخی از سیستم‌های بینایی کامپیوتری می‌توانند تصاویر با کیفیت بالا را بازیابی کنند. روی طرح ها به عنوان مثال، این مدل می تواند به درستی صدای تقلید یک انسان از «میو» گربه را در مقابل «هیس» آن تشخیص دهد.

در آینده، این مدل به طور بالقوه می‌تواند به رابط‌های بصری «مبتنی بر تقلید» برای طراحان صدا، کاراکترهای هوش مصنوعی بیشتر شبیه انسان در واقعیت مجازی و حتی روش‌هایی برای کمک به دانش‌آموزان در یادگیری زبان‌های جدید منجر شود.

نویسندگان همکار – دانشجویان دکترای MIT CSAIL، Kartik Chandra SM ’23 و Karima Ma، و محقق کارشناسی متیو کارن – خاطرنشان می کنند که محققان گرافیک کامپیوتری مدت هاست متوجه شده اند که واقع گرایی به ندرت هدف نهایی بیان بصری است. به عنوان مثال، یک نقاشی انتزاعی یا یک ابله مداد رنگی کودک می تواند به اندازه یک عکس گویا باشد.

چاندرا خاطرنشان می‌کند: «در چند دهه گذشته، پیشرفت‌ها در الگوریتم‌های طراحی منجر به ابزارهای جدیدی برای هنرمندان، پیشرفت‌هایی در هوش مصنوعی و بینایی رایانه‌ای و حتی درک عمیق‌تر از شناخت انسان شده است. همانطور که یک طرح یک نمایش انتزاعی و غیر فوتورالیستی از یک تصویر است، روش ما انتزاعی و غیرآوا را به تصویر می‌کشد.–روش های واقع بینانه ای که انسان ها صداهایی را که می شنوند بیان می کنند. این به ما در مورد process انتزاع شنیداری.»

پیشنهاد می‌کنیم بخوانید: ابزار استناد یک رویکرد جدید برای محتوای قابل اعتماد تولید شده توسط هوش مصنوعی ارائه می دهد

منبع: https://news.mit.edu/1404/teaching-ai-communicate-sounds-humans-do-0109

برای نگارش بخشهایی از این متن ممکن است از ترجمه ماشینی یا هوش مصنوعی GPT استفاده شده باشد
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم

زمان انتشار: 1404-01-10 00:03:08

امتیاز شما به این مطلب