از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
مجموعه داده های هوش مصنوعی مسیرهای جدیدی را برای تشخیص گردباد ایجاد می کند
بازگشت بهار در نیمکره شمالی فصل گردباد را لمس می کند. قیف پیچنده گرد و غبار و آوار، منظره ای غیرقابل انکار به نظر می رسد. اما این منظره را می توان برای رادار، ابزار هواشناسان، پنهان کرد. سخت است که بدانیم دقیقاً چه زمانی یک گردباد شکل گرفته است یا حتی چرا.
یک مجموعه داده جدید می تواند پاسخ ها را در خود جای دهد. این شامل بازگشت راداری از هزاران گردباد است که در 10 سال گذشته به ایالات متحده برخورد کرده است. طوفان هایی که گردبادها را به وجود آوردند با طوفان های شدید دیگری احاطه می شوند، برخی با شرایط تقریباً یکسانی که هرگز چنین نشد. محققان آزمایشگاه لینکلن MIT که مجموعه داده ها به نام TorNet را سرپرستی کردند، اکنون آن را منبع باز منتشر کرده اند. آنها امیدوارند که بتوانند پیشرفت هایی را در شناسایی یکی از مرموزترین و خشن ترین پدیده های طبیعت انجام دهند.
«پیشرفتهای زیادی توسط مجموعه دادههای معیار و به راحتی قابل دسترس انجام میشود. مارک ویلت، محقق اصلی پروژه به همراه جیمز کردزو میگوید: امیدواریم تورنت پایهای برای الگوریتمهای یادگیری ماشینی برای شناسایی و پیشبینی گردبادها ایجاد کند. هر دو محقق در گروه سیستم های کنترل ترافیک هوایی کار می کنند.
همراه با مجموعه داده، تیم در حال انتشار مدل های آموزش دیده است روی آی تی. مدلها نویدبخش توانایی یادگیری ماشینی در تشخیص چرخش هستند. ساختمان روی این کار می تواند مرزهای جدیدی را برای پیش بینی ها باز کند و به آنها کمک کند تا هشدارهای دقیق تری ارائه دهند که ممکن است جان انسان ها را نجات دهد.
عدم قطعیت چرخشی
سالانه حدود 1200 گردباد در ایالات متحده رخ می دهد که میلیون ها تا میلیارد دلار خسارت اقتصادی به بار می آورد و جان 71 نفر را می گیرد. روی میانگین. سال گذشته، یک گردباد غیرمعمول طولانی مدت در مسیری به طول 59 مایلی در می سی سی پی، 17 نفر را کشت و دست کم 165 نفر را مجروح کرد.
با این حال، پیشبینی گردبادها بسیار دشوار است، زیرا دانشمندان تصویر روشنی از علت شکلگیری آنها ندارند. ما میتوانیم دو طوفان را ببینیم که یکسان به نظر میرسند، یکی باعث ایجاد گردباد میشود و دیگری نمیتواند. ما به طور کامل آن را درک نمی کنیم،” کردزو می گوید.
اجزای اصلی گردباد طوفان های تندری با ناپایداری ناشی از افزایش سریع هوای گرم و برش باد است که باعث چرخش می شود. رادار هواشناسی ابزار اصلی مورد استفاده برای نظارت بر این شرایط است. اما گردبادها حتی زمانی که نسبتاً نزدیک به رادار هستند، بسیار پایین هستند و قابل شناسایی نیستند. همانطور که پرتو رادار با یک زاویه شیب معین از آنتن دورتر می شود، از سطح زمین بالاتر می رود و عمدتاً بازتاب های باران و تگرگ را می بیند که در “مزوسیکلون”، جریان بالا و چرخش طوفان گسترده است. مزوسیکلون همیشه گردباد تولید نمی کند.
با این دیدگاه محدود، پیش بینی ها باید تصمیم بگیرند که آیا هشدار گردباد را صادر کنند یا نه. آنها اغلب اشتباه می کنند روی طرف احتیاط در نتیجه، میزان هشدارهای اشتباه برای هشدارهای گردباد بیش از 70 درصد است. کوردزو میگوید: «این میتواند به سندرم پسر-گرگ-گرگ منجر شود.
در سالهای اخیر، محققان برای شناسایی و پیشبینی بهتر گردبادها به یادگیری ماشین روی آوردهاند. با این حال، مجموعه دادهها و مدلهای خام همیشه برای جامعه گستردهتر قابل دسترسی نبوده و پیشرفت را خفه میکنند. تورنت این شکاف را پر می کند.
مجموعه داده شامل بیش از 200000 تصویر راداری است که 13587 مورد آن گردباد را به تصویر می کشد. بقیه تصاویر غیر گردباد هستند و از طوفانها در یکی از دو دسته گرفته شدهاند: طوفانهای شدید تصادفی انتخاب شده یا طوفانهای هشدار کاذب (آنهایی که پیشبینیکننده را وادار به صدور هشدار کردند اما گردباد ایجاد نکردند).
هر نمونه از یک طوفان یا گردباد شامل دو مجموعه از شش تصویر راداری است. این دو مجموعه با زوایای جابجایی رادار متفاوت مطابقت دارند. این شش تصویر محصولات مختلف دادههای راداری، مانند بازتاب (نشان دادن شدت بارش) یا سرعت شعاعی (که نشان میدهد باد به سمت رادار یا دور از رادار حرکت میکند) را به تصویر میکشد.
یک چالش در مدیریت مجموعه داده ابتدا پیدا کردن گردبادها بود. در مجموعه داده های رادار آب و هوا، گردبادها رویدادهای بسیار نادری هستند. سپس تیم مجبور شد آن نمونه های گردباد را با نمونه های دشوار غیر گردبادی متعادل کند. اگر مجموعه داده خیلی آسان بود، مثلاً با مقایسه گردبادها با طوفان های برفی، یک الگوریتم آموزش داده شد. روی دادهها احتمالاً طوفانها را بیش از حد به عنوان گردباد طبقهبندی میکنند.
Veillette میگوید: «آنچه در مورد یک مجموعه داده معیار واقعی زیبا است این است که همه ما با دادههای یکسان، با همان سطح دشواری کار میکنیم و میتوانیم نتایج را با هم مقایسه کنیم». همچنین هواشناسی را برای دانشمندان داده قابل دسترس تر می کند و بالعکس. کار برای این دو طرف راحت تر می شود روی یک مشکل رایج.»
هر دو محقق پیشرفتی را نشان می دهند که می تواند از همکاری متقابل حاصل شود. Veillette یک ریاضیدان و توسعه دهنده الگوریتم است که مدتهاست مجذوب گردبادها شده است. کوردزو یک هواشناس با آموزش و کارشناس پردازش سیگنال است. در مقطع کارشناسی ارشد، او گردبادها را با رادارهای متحرک سفارشی تعقیب می کرد و داده ها را برای تجزیه و تحلیل به روش های جدید جمع آوری می کرد.
این مجموعه داده همچنین به این معنی است که یک دانش آموز فارغ التحصیل نیازی به صرف یک یا دو سال برای ساخت یک مجموعه داده ندارد. آنها می توانند مستقیماً وارد تحقیقات خود شوند.
این پروژه توسط ابتکار تغییر آب و هوا آزمایشگاه لینکلن تامین شد که هدف آن استفاده از نقاط قوت فنی متنوع آزمایشگاه برای کمک به رسیدگی به مشکلات آب و هوایی تهدید کننده سلامت انسان و امنیت جهانی است.
تعقیب پاسخ ها با یادگیری عمیق
با استفاده از مجموعه داده، محققان مدلهای هوش مصنوعی (AI) پایه را توسعه دادند. آنها به ویژه مشتاق به کار بردن یادگیری عمیق بودند، شکلی از یادگیری ماشینی که در پردازش داده های بصری برتری دارد. یادگیری عمیق به تنهایی می تواند ویژگی ها (مشاهدات کلیدی که یک الگوریتم از آنها برای تصمیم گیری استفاده می کند) از تصاویر در یک مجموعه داده استخراج کند. سایر رویکردهای یادگیری ماشینی، انسان را ملزم می کند که ابتدا به صورت دستی ویژگی ها را برچسب گذاری کند.
ویلت میگوید: «ما میخواستیم ببینیم که آیا یادگیری عمیق میتواند چیزی را که مردم معمولاً در گردبادها به دنبال آن هستند را دوباره کشف کند و حتی چیزهای جدیدی را شناسایی کند که معمولاً توسط پیشبینیکنندگان جستجو نمیشوند».
نتایج امیدوارکننده است. مدل یادگیری عمیق آنها مشابه یا بهتر از همه الگوریتمهای تشخیص گردباد شناخته شده در ادبیات عمل کرد. الگوریتم آموزش دیده به درستی 50 درصد از گردبادهای ضعیف تر EF-1 و بیش از 85 درصد از گردبادهای دارای رتبه EF-2 یا بالاتر را طبقه بندی کرد که مخرب ترین و پرهزینه ترین رخدادهای این طوفان ها را تشکیل می دهند.
آنها همچنین دو نوع دیگر از مدلهای یادگیری ماشینی و یک مدل سنتی را برای مقایسه با آن ارزیابی کردند. کد منبع و پارامترهای همه این مدل ها به صورت رایگان در دسترس هستند. مدلها و مجموعه دادهها همچنین در مقاله ارسال شده به مجله انجمن هواشناسی آمریکا (AMS) توضیح داده شده است. Veillette این اثر را در نشست سالانه AMS در ژانویه ارائه کرد.
کوردزو میگوید: «بزرگترین دلیل برای ارائه مدلهایمان این است که جامعه آنها را بهبود ببخشد و کارهای بزرگ دیگری انجام دهد. “بهترین راه حل می تواند یک مدل یادگیری عمیق باشد، یا ممکن است کسی بفهمد که یک مدل یادگیری غیرعمیق در واقع بهتر است.”
TorNet می تواند در جامعه آب و هوا برای استفاده های دیگر نیز مفید باشد، مانند انجام مطالعات موردی در مقیاس بزرگ روی طوفان ها همچنین میتوان آن را با سایر منابع داده، مانند تصاویر ماهوارهای یا نقشههای رعد و برق، تقویت کرد. ترکیب چندین نوع داده می تواند دقت مدل های یادگیری ماشین را بهبود بخشد.
گام برداشتن به سمت عملیات
علاوه بر شناسایی گردبادها، کوردزو امیدوار است که مدل ها ممکن است به کشف علم درباره علت شکل گیری آنها کمک کنند.
“به عنوان دانشمندان، ما همه این پیش سازهای گردباد را می بینیم – افزایش چرخش در سطح پایین، hook echo در دادههای انعکاس، قوسهای فاز دیفرانسیل خاص (KDP) و بازتاب دیفرانسیل (ZDR). اما چگونه همه آنها با هم پیش می روند؟ و آیا تظاهرات فیزیکی وجود دارد که ما از آنها اطلاع نداریم؟ او می پرسد.
ممکن است با هوش مصنوعی قابل توضیح، این پاسخها را به زبان بیاورید. هوش مصنوعی قابل توضیح به روشهایی اشاره میکند که به یک مدل اجازه میدهد استدلال خود را در قالبی قابل درک برای انسانها ارائه کند که چرا به یک تصمیم خاص رسیده است. در این مورد، این توضیحات ممکن است فرآیندهای فیزیکی را که قبل از گردباد اتفاق میافتند، نشان دهد. این دانش می تواند به آموزش پیش بینی کنندگان و مدل ها کمک کند تا علائم را زودتر تشخیص دهند.
هیچ یک از این فناوری هرگز قرار نیست جایگزین یک پیش بینی کننده شود. اما شاید روزی بتواند چشمهای پیشبینیکنندگان را در موقعیتهای پیچیده راهنمایی کند و به منطقهای که پیشبینی میشود فعالیت گردباد دارد، هشدار بصری بدهد.
چنین کمک هایی می تواند به ویژه با بهبود فناوری رادار و افزایش متراکم شدن شبکه های آینده مفید باشد. انتظار میرود نرخ بهروزرسانی دادهها در شبکه راداری نسل بعدی از هر پنج دقیقه به تقریباً یک دقیقه افزایش یابد، شاید سریعتر از آنچه پیشبینیکنندگان بتوانند اطلاعات جدید را تفسیر کنند. زیرا یادگیری عمیق می تواند process حجم عظیمی از داده ها به سرعت، می تواند برای نظارت بر بازگشت رادار در زمان واقعی، در کنار انسان ها مناسب باشد. گردبادها می توانند در عرض چند دقیقه تشکیل شوند و ناپدید شوند.
اما راه رسیدن به یک الگوریتم عملیاتی، بهویژه در شرایط بحرانی ایمنی، راه طولانی است. «من فکر میکنم جامعه پیشبینیکننده هنوز بهطور قابلتوجهی نسبت به یادگیری ماشینی شک دارد. یکی از راههای ایجاد اعتماد و شفافیت، داشتن مجموعه دادههای معیار عمومی مانند این است. این اولین قدم است.»
تیم امیدوار است گامهای بعدی توسط محققانی در سراسر جهان برداشته شود که از مجموعه دادهها الهام گرفتهاند و برای ساخت الگوریتمهای خود انرژی دارند. این الگوریتمها به نوبه خود به بسترهای آزمایشی میروند، جایی که در نهایت به پیشبینیکنندگان نشان داده میشوند تا شروع به کار کنند. process انتقال به عملیات
در پایان، مسیر می تواند به سمت اعتماد بازگردد.
ممکن است با استفاده از این ابزارها هرگز بیش از 10 تا 15 دقیقه هشدار گردباد دریافت نکنیم. اما اگر بتوانیم نرخ هشدار کاذب را کاهش دهیم، میتوانیم با درک عمومی شروع به پیشرفت کنیم.» کوردزو میگوید. مردم از این هشدارها برای انجام اقدامات لازم برای نجات جان خود استفاده خواهند کرد.»
منبع: https://news.mit.edu/1403/tornet-ai-dataset-carves-new-paths-tornado-detection-0429
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1403-04-30 19:38:15