سرور مجازی NVMe

مجموعه داده های هوش مصنوعی مسیرهای جدیدی را برای تشخیص گردباد ایجاد می کند

توسط مهران در اردیبهشت 11, 1403

مجموعه داده های هوش مصنوعی مسیرهای جدیدی را برای تشخیص گردباد ایجاد می کند

زمان لازم برای مطالعه: 7 دقیقه

بازگشت بهار در نیمکره شمالی فصل گردباد را لمس می کند. قیف پیچنده گرد و غبار و آوار، منظره ای غیرقابل انکار به نظر می رسد. اما این منظره را می توان برای رادار، ابزار هواشناسان، پنهان کرد. سخت است که بدانیم دقیقاً چه زمانی یک گردباد شکل گرفته است یا حتی چرا.

یک مجموعه داده جدید می تواند پاسخ ها را در خود جای دهد. این شامل بازگشت راداری از هزاران گردباد است که در 10 سال گذشته به ایالات متحده برخورد کرده است. طوفان هایی که گردبادها را به وجود آوردند با طوفان های شدید دیگری احاطه می شوند، برخی با شرایط تقریباً یکسانی که هرگز چنین نشد. محققان آزمایشگاه لینکلن MIT که مجموعه داده ها به نام TorNet را سرپرستی کردند، اکنون آن را منبع باز منتشر کرده اند. آنها امیدوارند که بتوانند پیشرفت هایی را در شناسایی یکی از مرموزترین و خشن ترین پدیده های طبیعت انجام دهند.

«پیشرفت‌های زیادی توسط مجموعه داده‌های معیار و به راحتی قابل دسترس انجام می‌شود. مارک ویلت، محقق اصلی پروژه به همراه جیمز کردزو می‌گوید: امیدواریم تورنت پایه‌ای برای الگوریتم‌های یادگیری ماشینی برای شناسایی و پیش‌بینی گردبادها ایجاد کند. هر دو محقق در گروه سیستم های کنترل ترافیک هوایی کار می کنند.

همراه با مجموعه داده، تیم در حال انتشار مدل های آموزش دیده است روی آی تی. مدل‌ها نویدبخش توانایی یادگیری ماشینی در تشخیص چرخش هستند. ساختمان روی این کار می تواند مرزهای جدیدی را برای پیش بینی ها باز کند و به آنها کمک کند تا هشدارهای دقیق تری ارائه دهند که ممکن است جان انسان ها را نجات دهد.

عدم قطعیت چرخشی

سالانه حدود 1200 گردباد در ایالات متحده رخ می دهد که میلیون ها تا میلیارد دلار خسارت اقتصادی به بار می آورد و جان 71 نفر را می گیرد. روی میانگین. سال گذشته، یک گردباد غیرمعمول طولانی مدت در مسیری به طول 59 مایلی در می سی سی پی، 17 نفر را کشت و دست کم 165 نفر را مجروح کرد.

با این حال، پیش‌بینی گردبادها بسیار دشوار است، زیرا دانشمندان تصویر روشنی از علت شکل‌گیری آن‌ها ندارند. ما می‌توانیم دو طوفان را ببینیم که یکسان به نظر می‌رسند، یکی باعث ایجاد گردباد می‌شود و دیگری نمی‌تواند. ما به طور کامل آن را درک نمی کنیم،” کردزو می گوید.

اجزای اصلی گردباد طوفان های تندری با ناپایداری ناشی از افزایش سریع هوای گرم و برش باد است که باعث چرخش می شود. رادار هواشناسی ابزار اصلی مورد استفاده برای نظارت بر این شرایط است. اما گردبادها حتی زمانی که نسبتاً نزدیک به رادار هستند، بسیار پایین هستند و قابل شناسایی نیستند. همانطور که پرتو رادار با یک زاویه شیب معین از آنتن دورتر می شود، از سطح زمین بالاتر می رود و عمدتاً بازتاب های باران و تگرگ را می بیند که در “مزوسیکلون”، جریان بالا و چرخش طوفان گسترده است. مزوسیکلون همیشه گردباد تولید نمی کند.

با این دیدگاه محدود، پیش بینی ها باید تصمیم بگیرند که آیا هشدار گردباد را صادر کنند یا نه. آنها اغلب اشتباه می کنند روی طرف احتیاط در نتیجه، میزان هشدارهای اشتباه برای هشدارهای گردباد بیش از 70 درصد است. کوردزو می‌گوید: «این می‌تواند به سندرم پسر-گرگ-گرگ منجر شود.

در سال‌های اخیر، محققان برای شناسایی و پیش‌بینی بهتر گردبادها به یادگیری ماشین روی آورده‌اند. با این حال، مجموعه داده‌ها و مدل‌های خام همیشه برای جامعه گسترده‌تر قابل دسترسی نبوده و پیشرفت را خفه می‌کنند. تورنت این شکاف را پر می کند.

مجموعه داده شامل بیش از 200000 تصویر راداری است که 13587 مورد آن گردباد را به تصویر می کشد. بقیه تصاویر غیر گردباد هستند و از طوفان‌ها در یکی از دو دسته گرفته شده‌اند: طوفان‌های شدید تصادفی انتخاب شده یا طوفان‌های هشدار کاذب (آنهایی که پیش‌بینی‌کننده را وادار به صدور هشدار کردند اما گردباد ایجاد نکردند).

پیشنهاد می‌کنیم بخوانید: محققان با حفظ یا بهبود دقت، سوگیری را در مدل‌های هوش مصنوعی کاهش می‌دهند

هر نمونه از یک طوفان یا گردباد شامل دو مجموعه از شش تصویر راداری است. این دو مجموعه با زوایای جابجایی رادار متفاوت مطابقت دارند. این شش تصویر محصولات مختلف داده‌های راداری، مانند بازتاب (نشان دادن شدت بارش) یا سرعت شعاعی (که نشان می‌دهد باد به سمت رادار یا دور از رادار حرکت می‌کند) را به تصویر می‌کشد.

یک چالش در مدیریت مجموعه داده ابتدا پیدا کردن گردبادها بود. در مجموعه داده های رادار آب و هوا، گردبادها رویدادهای بسیار نادری هستند. سپس تیم مجبور شد آن نمونه های گردباد را با نمونه های دشوار غیر گردبادی متعادل کند. اگر مجموعه داده خیلی آسان بود، مثلاً با مقایسه گردبادها با طوفان های برفی، یک الگوریتم آموزش داده شد. روی داده‌ها احتمالاً طوفان‌ها را بیش از حد به عنوان گردباد طبقه‌بندی می‌کنند.

Veillette می‌گوید: «آنچه در مورد یک مجموعه داده معیار واقعی زیبا است این است که همه ما با داده‌های یکسان، با همان سطح دشواری کار می‌کنیم و می‌توانیم نتایج را با هم مقایسه کنیم». همچنین هواشناسی را برای دانشمندان داده قابل دسترس تر می کند و بالعکس. کار برای این دو طرف راحت تر می شود روی یک مشکل رایج.»

هر دو محقق پیشرفتی را نشان می دهند که می تواند از همکاری متقابل حاصل شود. Veillette یک ریاضیدان و توسعه دهنده الگوریتم است که مدتهاست مجذوب گردبادها شده است. کوردزو یک هواشناس با آموزش و کارشناس پردازش سیگنال است. در مقطع کارشناسی ارشد، او گردبادها را با رادارهای متحرک سفارشی تعقیب می کرد و داده ها را برای تجزیه و تحلیل به روش های جدید جمع آوری می کرد.

این مجموعه داده همچنین به این معنی است که یک دانش آموز فارغ التحصیل نیازی به صرف یک یا دو سال برای ساخت یک مجموعه داده ندارد. آنها می توانند مستقیماً وارد تحقیقات خود شوند.

این پروژه توسط ابتکار تغییر آب و هوا آزمایشگاه لینکلن تامین شد که هدف آن استفاده از نقاط قوت فنی متنوع آزمایشگاه برای کمک به رسیدگی به مشکلات آب و هوایی تهدید کننده سلامت انسان و امنیت جهانی است.

تعقیب پاسخ ها با یادگیری عمیق

با استفاده از مجموعه داده، محققان مدل‌های هوش مصنوعی (AI) پایه را توسعه دادند. آنها به ویژه مشتاق به کار بردن یادگیری عمیق بودند، شکلی از یادگیری ماشینی که در پردازش داده های بصری برتری دارد. یادگیری عمیق به تنهایی می تواند ویژگی ها (مشاهدات کلیدی که یک الگوریتم از آنها برای تصمیم گیری استفاده می کند) از تصاویر در یک مجموعه داده استخراج کند. سایر رویکردهای یادگیری ماشینی، انسان را ملزم می کند که ابتدا به صورت دستی ویژگی ها را برچسب گذاری کند.

ویلت می‌گوید: «ما می‌خواستیم ببینیم که آیا یادگیری عمیق می‌تواند چیزی را که مردم معمولاً در گردبادها به دنبال آن هستند را دوباره کشف کند و حتی چیزهای جدیدی را شناسایی کند که معمولاً توسط پیش‌بینی‌کنندگان جستجو نمی‌شوند».

نتایج امیدوارکننده است. مدل یادگیری عمیق آنها مشابه یا بهتر از همه الگوریتم‌های تشخیص گردباد شناخته شده در ادبیات عمل کرد. الگوریتم آموزش دیده به درستی 50 درصد از گردبادهای ضعیف تر EF-1 و بیش از 85 درصد از گردبادهای دارای رتبه EF-2 یا بالاتر را طبقه بندی کرد که مخرب ترین و پرهزینه ترین رخدادهای این طوفان ها را تشکیل می دهند.

آنها همچنین دو نوع دیگر از مدل‌های یادگیری ماشینی و یک مدل سنتی را برای مقایسه با آن ارزیابی کردند. کد منبع و پارامترهای همه این مدل ها به صورت رایگان در دسترس هستند. مدل‌ها و مجموعه داده‌ها همچنین در مقاله ارسال شده به مجله انجمن هواشناسی آمریکا (AMS) توضیح داده شده است. Veillette این اثر را در نشست سالانه AMS در ژانویه ارائه کرد.

کوردزو می‌گوید: «بزرگ‌ترین دلیل برای ارائه مدل‌هایمان این است که جامعه آنها را بهبود ببخشد و کارهای بزرگ دیگری انجام دهد. “بهترین راه حل می تواند یک مدل یادگیری عمیق باشد، یا ممکن است کسی بفهمد که یک مدل یادگیری غیرعمیق در واقع بهتر است.”

پیشنهاد می‌کنیم بخوانید: بوم شناسان نقاط کور مدل های بینایی کامپیوتری را در بازیابی تصاویر حیات وحش پیدا می کنند

TorNet می تواند در جامعه آب و هوا برای استفاده های دیگر نیز مفید باشد، مانند انجام مطالعات موردی در مقیاس بزرگ روی طوفان ها همچنین می‌توان آن را با سایر منابع داده، مانند تصاویر ماهواره‌ای یا نقشه‌های رعد و برق، تقویت کرد. ترکیب چندین نوع داده می تواند دقت مدل های یادگیری ماشین را بهبود بخشد.

گام برداشتن به سمت عملیات

علاوه بر شناسایی گردبادها، کوردزو امیدوار است که مدل ها ممکن است به کشف علم درباره علت شکل گیری آنها کمک کنند.

“به عنوان دانشمندان، ما همه این پیش سازهای گردباد را می بینیم – افزایش چرخش در سطح پایین، hook echo در داده‌های انعکاس، قوس‌های فاز دیفرانسیل خاص (KDP) و بازتاب دیفرانسیل (ZDR). اما چگونه همه آنها با هم پیش می روند؟ و آیا تظاهرات فیزیکی وجود دارد که ما از آنها اطلاع نداریم؟ او می پرسد.

ممکن است با هوش مصنوعی قابل توضیح، این پاسخ‌ها را به زبان بیاورید. هوش مصنوعی قابل توضیح به روش‌هایی اشاره می‌کند که به یک مدل اجازه می‌دهد استدلال خود را در قالبی قابل درک برای انسان‌ها ارائه کند که چرا به یک تصمیم خاص رسیده است. در این مورد، این توضیحات ممکن است فرآیندهای فیزیکی را که قبل از گردباد اتفاق می‌افتند، نشان دهد. این دانش می تواند به آموزش پیش بینی کنندگان و مدل ها کمک کند تا علائم را زودتر تشخیص دهند.

هیچ یک از این فناوری هرگز قرار نیست جایگزین یک پیش بینی کننده شود. اما شاید روزی بتواند چشم‌های پیش‌بینی‌کنندگان را در موقعیت‌های پیچیده راهنمایی کند و به منطقه‌ای که پیش‌بینی می‌شود فعالیت گردباد دارد، هشدار بصری بدهد.

چنین کمک هایی می تواند به ویژه با بهبود فناوری رادار و افزایش متراکم شدن شبکه های آینده مفید باشد. انتظار می‌رود نرخ به‌روزرسانی داده‌ها در شبکه راداری نسل بعدی از هر پنج دقیقه به تقریباً یک دقیقه افزایش یابد، شاید سریع‌تر از آن‌چه پیش‌بینی‌کنندگان بتوانند اطلاعات جدید را تفسیر کنند. زیرا یادگیری عمیق می تواند process حجم عظیمی از داده ها به سرعت، می تواند برای نظارت بر بازگشت رادار در زمان واقعی، در کنار انسان ها مناسب باشد. گردبادها می توانند در عرض چند دقیقه تشکیل شوند و ناپدید شوند.

اما راه رسیدن به یک الگوریتم عملیاتی، به‌ویژه در شرایط بحرانی ایمنی، راه طولانی است. «من فکر می‌کنم جامعه پیش‌بینی‌کننده هنوز به‌طور قابل‌توجهی نسبت به یادگیری ماشینی شک دارد. یکی از راه‌های ایجاد اعتماد و شفافیت، داشتن مجموعه داده‌های معیار عمومی مانند این است. این اولین قدم است.»

تیم امیدوار است گام‌های بعدی توسط محققانی در سراسر جهان برداشته شود که از مجموعه داده‌ها الهام گرفته‌اند و برای ساخت الگوریتم‌های خود انرژی دارند. این الگوریتم‌ها به نوبه خود به بسترهای آزمایشی می‌روند، جایی که در نهایت به پیش‌بینی‌کنندگان نشان داده می‌شوند تا شروع به کار کنند. process انتقال به عملیات

در پایان، مسیر می تواند به سمت اعتماد بازگردد.

ممکن است با استفاده از این ابزارها هرگز بیش از 10 تا 15 دقیقه هشدار گردباد دریافت نکنیم. اما اگر بتوانیم نرخ هشدار کاذب را کاهش دهیم، می‌توانیم با درک عمومی شروع به پیشرفت کنیم.» کوردزو می‌گوید. مردم از این هشدارها برای انجام اقدامات لازم برای نجات جان خود استفاده خواهند کرد.»

منبع: https://news.mit.edu/1403/tornet-ai-dataset-carves-new-paths-tornado-detection-0429

برای نگارش بخشهایی از این متن ممکن است از ترجمه ماشینی یا هوش مصنوعی GPT استفاده شده باشد
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم

زمان انتشار: 1403-04-30 19:38:15

امتیاز شما به این مطلب