از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
وانا به کاربران اجازه می دهد یک قطعه از مدل های AI را آموزش دهند روی داده های آنها

در فوریه 1403 ، Reddit با Google معامله 60 میلیون دلاری با Google انجام داد تا غول جستجو از داده ها استفاده کند روی سکوی برای آموزش مدلهای هوش مصنوعی خود. به ویژه در بحث ها ، کاربران Reddit وجود نداشت که داده های آنها فروخته می شد.
این معامله واقعیت اینترنت مدرن را منعکس می کند: شرکت های بزرگ فناوری تقریباً تمام داده های آنلاین ما را در اختیار دارند و تصمیم می گیرند که با آن داده ها چه کاری انجام دهند. با کمال تعجب ، بسیاری از سیستم عامل ها از داده های خود سود می برند ، و سریعترین راه برای تحقق این امر امروز فروش آن به شرکت های هوش مصنوعی ، که خود شرکت های فناوری گسترده ای هستند با استفاده از داده ها برای آموزش مدل های قدرتمندتر هستند.
سکوی غیر متمرکز وانا ، که به عنوان یک پروژه کلاس در MIT آغاز شد ، است روی مأموریتی برای بازگرداندن قدرت به کاربران. این شرکت یک شبکه کاملاً متعلق به کاربر ایجاد کرده است که به افراد امکان می دهد داده های خود را بارگذاری کرده و روش استفاده از آنها را اداره کنند. توسعه دهندگان AI می توانند کاربران را به زمین بزنند روی ایده هایی برای مدل های جدید ، و اگر کاربران موافقت کنند که داده های خود را برای آموزش کمک کنند ، در مدل ها مالکیت متناسب دریافت می کنند.
ایده این است که همه را در سیستم های هوش مصنوعی سهم داشته باشیم که جامعه ما را به طور فزاینده ای شکل می دهد و در عین حال باز کردن استخرهای جدید از داده ها برای پیشبرد فناوری نیز باز می شود.
آنا کازلوسکاس ، بنیانگذار وانا می گوید: “این داده ها برای ایجاد سیستم های بهتر AI لازم است.” “ما یک سیستم غیر متمرکز ایجاد کرده ایم تا داده های بهتری کسب کنیم – که امروز در شرکت های بزرگ فناوری قرار دارد – در حالی که هنوز به کاربران اجازه می دهد مالکیت نهایی را حفظ کنند.”
از اقتصاد گرفته تا blockchain
بسیاری از دانش آموزان دبیرستانی عکس هایی از ستاره های پاپ یا ورزشکاران دارند روی دیوارهای اتاق خواب آنها. کازلوسکاس تصویری از جنت یلن ، دبیر پیشین خزانه داری ایالات متحده داشت.
کازلوسکاس برای اطمینان از اینکه او یک اقتصاددان شد ، آمد ، اما او به عنوان یکی از پنج دانش آموز برای پیوستن به باشگاه MIT Bitcoin در سال 2015 به پایان رسید و این تجربه او را به دنیای blockchains و cryptocurrency سوق داد.
از اتاق خوابگاه خود در خانه مک گرگور ، او شروع به استخراج Cryptocurrency Ethereum کرد. او حتی گاهی اوقات در جستجوی تراشه های رایانه ای دور ریخته شده ، دامپزشکان پردیس را خرد می کرد.
کازلوسکاس می گوید: “این به من علاقه مند به همه چیز در اطراف علوم کامپیوتر و شبکه سازی شد.” “این درگیر ، از دیدگاه blockchain ، سیستم های توزیع شده و چگونگی تغییر قدرت اقتصادی به افراد ، و همچنین هوش مصنوعی و اقتصاد.”
کازلوسکاس با هنر Abal ، که در آن زمان در دانشگاه هاروارد شرکت می کرد ، در کلاس های سابق آزمایشگاه رسانه های آزمایشگاهی ، ملاقات کرد و این زوج تصمیم به کار گرفتند روی راه های جدید برای به دست آوردن داده ها برای آموزش سیستم های هوش مصنوعی.
“سوال ما این بود: چگونه می توانید تعداد زیادی از افراد را که با استفاده از بیشتر یک شبکه توزیع شده در این سیستم های هوش مصنوعی مشارکت می کنند ، داشته باشید؟” کازلوسکاس به یاد می آورد.
Kazlauskas و Abal در تلاش بودند تا وضع موجود را بپردازند ، جایی که بیشتر مدل ها با استفاده از داده های عمومی آموزش داده می شوند روی اینترنت شرکت های بزرگ فناوری غالباً مجموعه داده های بزرگی را از سایر شرکت ها خریداری می کنند.
رویکرد بنیانگذاران طی سالها تکامل یافت و از تجربه کازلوسکاس پس از فارغ التحصیلی در شرکت Blockchain مالی CELO مطلع شد. اما کازلوسکاس وقت خود را در MIT برای کمک به فکر کردن در مورد این مشکلات اعتبار می دهد ، و مربی سرمایه گذاری های ظهور ، رامش راسکار ، هنوز هم به وانا کمک می کند تا امروز درباره سؤالات تحقیق هوش مصنوعی فکر کند.
کازلاوسکاس می گوید: “این بسیار عالی بود که فرصتی آزاد برای ساخت ، هک و کاوش داشته باشید.” “من فکر می کنم که اخلاق در MIT بسیار مهم است. این فقط در مورد ساختن چیزها ، دیدن چه کار می کند و به تکرار ادامه می یابد.”
امروز وانا از یک قانون کمی شناخته شده استفاده می کند که به کاربران اکثر سیستم عامل های بزرگ فناوری اجازه می دهد export داده های آنها به طور مستقیم. کاربران می توانند این اطلاعات را در کیف پول های دیجیتالی رمزگذاری شده در وانا بارگذاری کرده و آن را برای آموزش مدل ها به عنوان مناسب ، پرداخت کنند.
مهندسان هوش مصنوعی می توانند ایده هایی را برای مدل های جدید منبع باز پیشنهاد دهند و افراد می توانند داده های خود را برای کمک به آموزش مدل جمع آوری کنند. در دنیای blockchain ، استخرهای داده Data DAOS نامیده می شوند ، که مخفف سازمان خودمختار غیر متمرکز است. همچنین می توان از داده ها برای ایجاد مدل ها و عوامل هوش مصنوعی شخصی استفاده کرد.
در وانا ، از داده ها به گونه ای استفاده می شود که حریم شخصی کاربر را حفظ می کند زیرا سیستم اطلاعات قابل شناسایی را در معرض نمایش قرار نمی دهد. پس از ایجاد این مدل ، کاربران مالکیت را حفظ می کنند به طوری روی چقدر داده های آنها به آموزش آن کمک کرده است.
کازلوسکاس می گوید: “از دیدگاه یک توسعه دهنده ، اکنون می توانید این برنامه های بهداشتی بیش از حد شخصی را ایجاد کنید که دقیقاً آنچه را که می خورید ، روش خوابیدن ، روش ورزش کردن ، در نظر می گیرد.” “این برنامه ها امروز به دلیل آن باغ های دیواری شرکت های بزرگ فناوری امکان پذیر نیستند.”
AI متعلق به کاربر ،
سال گذشته ، یک مهندس یادگیری ماشین با استفاده از داده های کاربر VANA برای آموزش یک مدل هوش مصنوعی که می تواند پست های Reddit ایجاد کند ، پیشنهاد کرد. بیش از 140،000 کاربر وانا داده های Reddit خود را که شامل پست ها ، نظرات ، پیام ها و موارد دیگر بود ، کمک کردند. کاربران تصمیم گرفتند روی اصطلاحاتی که می توان از آن استفاده کرد ، و آنها پس از ایجاد آن ، مالکیت مدل را حفظ کردند.
وانا ابتکارات مشابهی را با داده های توزیع شده توسط کاربر از بستر رسانه های اجتماعی X امکان پذیر کرده است. داده های خواب از منابعی مانند حلقه های مارا ؛ و بیشتر همچنین همکاری هایی وجود دارد که استخرهای داده را برای ایجاد برنامه های گسترده تر AI ترکیب می کند.
“بیایید بگوییم کاربران دارای داده های Spotify ، داده های Reddit و داده های مد هستند.” کازلوسکاس توضیح می دهد. “معمولاً ، Spotify قصد همکاری با آن دسته از شرکت ها را ندارد ، و در واقع مقررات مربوط به آن وجود دارد. اما کاربران می توانند در صورت دسترسی به آنها این کار را انجام دهند ، بنابراین می توان از این مجموعه داده های متقابل استفاده کرد تا برای ایجاد مدل های واقعاً قدرتمند استفاده شود.”
وانا دارای بیش از 1 میلیون کاربر و بیش از 20 DAS DAIS LIVE DATA است. بیش از 300 استخر داده اضافی توسط کاربران پیشنهاد شده است روی سیستم وانا ، و کازلوسکاس می گوید بسیاری از افراد امسال وارد تولید می شوند.
کازلوسکاس می گوید: “من فکر می کنم در مدلهای هوش مصنوعی عمومی ، داروهای شخصی و برنامه های جدید مصرف کننده وعده های زیادی وجود دارد ، زیرا ترکیب این داده ها یا دسترسی به آن در وهله اول دشوار است.”
استخرهای داده به گروه های کاربران امکان می دهند تا حتی قدرتمندترین شرکت های فناوری را با امروز با آن دست و پنجه نرم کنند.
کازلوسکاس می گوید: “امروز ، شرکت های بزرگ فناوری این داده های داده را ساخته اند ، بنابراین بهترین مجموعه داده ها در دسترس کسی نیست.” “این یک مشکل اقدام جمعی است ، جایی که داده های من روی خودشان چندان ارزشمند نیست ، اما یک استخر داده با ده ها هزار یا میلیون ها نفر واقعاً با ارزش است. وانا اجازه می دهد تا این استخرها ساخته شود. این یک برد برنده است: کاربران به دلیل داشتن مدلها ، از ظهور هوش مصنوعی بهره مند می شوند. سپس شما به سناریویی پایان نمی دهید که در آن یک شرکت واحد کنترل یک مدل هوش مصنوعی تمام قدرت را ندارید. شما فناوری بهتری می گیرید ، اما همه از مزایای آن استفاده می کنند. “
منبع: https://news.mit.edu/1404/vana-lets-users-own-piece-ai-models-trained-روی-their-data-0403
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1404-04-03 10:11:08