از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
یک نظریه علی برای مطالعه روابط علت و معلولی ژن ها
با مطالعه تغییرات در بیان ژن، محققان می آموزند که سلول ها چگونه در سطح مولکولی عمل می کنند، که می تواند به آنها در درک پیشرفت بیماری های خاص کمک کند.
اما یک انسان حدود 20000 ژن دارد که می توانند به روش های پیچیده ای بر یکدیگر تأثیر بگذارند، بنابراین حتی دانستن اینکه کدام گروه از ژن ها را هدف قرار دهید یک مشکل بسیار پیچیده است. همچنین، ژن ها در ماژول هایی با هم کار می کنند که یکدیگر را تنظیم می کنند.
محققان MIT اکنون مبانی نظری را برای روشهایی ایجاد کردهاند که میتوانند بهترین راه برای تجمیع ژنها در گروههای مرتبط را شناسایی کنند تا بتوانند به طور موثر روابط علت و معلولی بین بسیاری از ژنها را بیاموزند.
نکته مهم این است که این روش جدید تنها با استفاده از داده های مشاهده ای این کار را انجام می دهد. این بدان معناست که محققان نیازی به انجام آزمایشهای مداخلهای پرهزینه و گاهی غیرممکن برای به دست آوردن دادههای مورد نیاز برای استنتاج روابط علّی اساسی ندارند.
در دراز مدت، این تکنیک می تواند به دانشمندان کمک کند تا اهداف ژنی بالقوه را برای القای رفتارهای خاص به شیوه ای دقیق تر و کارآمدتر شناسایی کنند و به طور بالقوه آنها را قادر می سازد تا درمان های دقیقی برای بیماران ایجاد کنند.
“در ژنومیک، درک مکانیسم زیربنایی حالات سلولی بسیار مهم است. اما سلولها ساختار چند مقیاسی دارند، بنابراین سطح خلاصهسازی نیز بسیار مهم است. جیاقی ژانگ، دانشجوی فارغ التحصیل، همکار مرکز اریک و وندی اشمیت و یکی از نویسندگان مقاله می گوید: اگر راه درستی برای جمع آوری داده های مشاهده شده پیدا کنید، اطلاعاتی که در مورد سیستم می آموزید باید قابل تفسیرتر و مفیدتر باشد. روی این تکنیک
ژانگ ملحق شد روی مقاله توسط رایان ولش، نویسنده همکار، که در حال حاضر دانشجوی کارشناسی ارشد مهندسی است. و نویسنده ارشد کارولین اوهلر، استاد گروه مهندسی برق و علوم کامپیوتر (EECS) و موسسه داده، سیستمها و جامعه (IDSS) که همچنین مدیر مرکز اریک و وندی اشمیت در موسسه Broad MIT است. و هاروارد، و یک محقق در آزمایشگاه MIT برای اطلاعات و سیستم های تصمیم گیری (LIDS). این تحقیق در کنفرانس ارائه خواهد شد روی سیستم های پردازش اطلاعات عصبی
یادگیری از داده های مشاهده ای
مشکلی که محققان تصمیم گرفتند با آن مقابله کنند شامل یادگیری برنامه های ژن ها است. این برنامه ها توصیف می کنند که کدام ژن ها با هم برای تنظیم ژن های دیگر در یک بیولوژیکی عمل می کنند processمانند رشد یا تمایز سلولی.
از آنجایی که دانشمندان نمی توانند به طور موثر بررسی کنند که چگونه همه 20000 ژن برهمکنش دارند، از تکنیکی به نام گسستگی علّی استفاده می کنند تا یاد بگیرند که چگونه گروه های مرتبط از ژن ها را در یک نمایش ترکیب کنند که به آنها اجازه می دهد به طور موثر روابط علت و معلولی را کشف کنند.
در کار قبلی، محققان نشان دادند که چگونه میتوان این کار را به طور موثر در حضور دادههای مداخلهای انجام داد، که دادههایی هستند که توسط متغیرهای مزاحم در شبکه به دست میآیند.
اما انجام آزمایشهای مداخلهای اغلب پرهزینه است، و سناریوهایی وجود دارد که چنین آزمایشهایی یا غیراخلاقی هستند یا فناوری به اندازه کافی برای موفقیت مداخله خوب نیست.
تنها با دادههای مشاهدهای، محققان نمیتوانند ژنها را قبل و بعد از مداخله مقایسه کنند تا بدانند گروههایی از ژنها چگونه با هم کار میکنند.
ژانگ میگوید: «بیشتر تحقیقات در زمینه گسستگی علّی، دسترسی به مداخلات را فرض میکنند، بنابراین مشخص نیست که چه مقدار اطلاعات را میتوان تنها با دادههای مشاهدهای تفکیک کرد.
محققان MIT یک رویکرد کلی تری ایجاد کردند که از یک الگوریتم یادگیری ماشینی برای شناسایی و جمعآوری مؤثر گروههای متغیرهای مشاهدهشده، به عنوان مثال، ژنها، تنها با استفاده از دادههای مشاهدهای استفاده میکند.
آنها میتوانند از این تکنیک برای شناسایی ماژولهای علّی و بازسازی یک نمایش زیربنایی دقیق از مکانیسم علت و معلولی استفاده کنند. در حالی که انگیزه این تحقیق مشکل تبیین برنامه های سلولی بود، ابتدا باید نظریه علی جدید را توسعه می دادیم تا بفهمیم چه چیزی را می توان و چه چیزی را نمی توان از داده های مشاهده آموخت. اوهلر میگوید با در دست داشتن این نظریه، در کارهای آینده میتوانیم درک خود را روی دادههای ژنتیکی اعمال کنیم و ماژولهای ژنی و همچنین روابط نظارتی آنها را شناسایی کنیم.
یک نمایش لایه ای
با استفاده از تکنیکهای آماری، محققان میتوانند یک تابع ریاضی معروف به واریانس برای ژاکوبین امتیاز هر متغیر را محاسبه کنند. متغیرهای علی که بر هیچ متغیر بعدی تأثیر نمی گذارند باید واریانس صفر داشته باشند.
محققان این نمایش را در ساختار لایه به لایه بازسازی میکنند و با حذف متغیرهای لایه پایینی که واریانس صفر دارند، شروع میکنند. سپس آنها لایه به لایه به عقب کار می کنند و متغیرها را با واریانس صفر حذف می کنند تا مشخص شود که کدام متغیرها یا گروه هایی از ژن ها به هم متصل هستند.
ژانگ میگوید: «شناسایی واریانسهایی که صفر هستند به سرعت به یک هدف ترکیبی تبدیل میشود که حل آن بسیار سخت است، بنابراین استخراج یک الگوریتم کارآمد که بتواند آن را حل کند یک چالش بزرگ بود.
در پایان، روش آنها یک نمایش انتزاعی از دادههای مشاهدهشده را با لایههایی از متغیرهای به هم پیوسته به دست میدهد که ساختار علت و معلولی زیربنایی را بهطور دقیق خلاصه میکند.
هر متغیر نشاندهنده گروهی از ژنها است که با هم عمل میکنند و رابطه بین دو متغیر نشان میدهد که چگونه یک گروه از ژنها گروهی دیگر را تنظیم میکنند. روش آنها به طور موثر تمام اطلاعات مورد استفاده در تعیین هر لایه از متغیرها را جمع آوری می کند.
پس از اثبات اینکه تکنیک آنها از نظر تئوری درست است، محققان شبیه سازی هایی را انجام دادند تا نشان دهند که این الگوریتم می تواند به طور موثر بازنمایی های علّی معنادار را تنها با استفاده از داده های مشاهده ای از هم جدا کند.
در آینده، محققان میخواهند این تکنیک را در کاربردهای ژنتیکی در دنیای واقعی به کار ببرند. آنها همچنین میخواهند کشف کنند که چگونه روش آنها میتواند بینشهای بیشتری را در موقعیتهایی که برخی از دادههای مداخلهای در دسترس هستند ارائه دهد یا به دانشمندان کمک کند تا چگونگی طراحی مداخلات ژنتیکی مؤثر را درک کنند. در آینده، این روش می تواند به محققان کمک کند تا به طور مؤثرتری تعیین کنند که کدام ژن در یک برنامه با هم کار می کنند، که می تواند به شناسایی داروهایی کمک کند که می توانند آن ژن ها را برای درمان بیماری های خاص هدف قرار دهند.
این تحقیق تا حدی توسط آزمایشگاه هوش مصنوعی MIT-IBM Watson و دفتر تحقیقات نیروی دریایی ایالات متحده تامین می شود.
منبع: https://news.mit.edu/1403/causal-theory-studying-cause-and-effect-relationships-genes-1107
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1403-11-08 02:33:10