سرور مجازی NVMe

یک تکنیک محاسباتی جدید می‌تواند مهندسی پروتئین‌های مفید را آسان‌تر کند

توسط مهران در فروردین 15, 1403

یک تکنیک محاسباتی جدید می‌تواند مهندسی پروتئین‌های مفید را آسان‌تر کند

زمان لازم برای مطالعه: 5 دقیقه

برای مهندسی پروتئین‌هایی با عملکردهای مفید، محققان معمولاً با یک پروتئین طبیعی که عملکرد مطلوبی مانند گسیل نور فلورسنت دارد، شروع می‌کنند و آن را در جهش‌های تصادفی زیادی قرار می‌دهند که در نهایت یک نسخه بهینه از پروتئین تولید می‌کند.

این process نسخه های بهینه بسیاری از پروتئین های مهم، از جمله پروتئین فلورسنت سبز (GFP) را به دست آورده است. با این حال، برای سایر پروتئین‌ها، تولید یک نسخه بهینه دشوار است. محققان MIT اکنون یک رویکرد محاسباتی ایجاد کرده‌اند که پیش‌بینی جهش‌هایی که منجر به پروتئین‌های بهتر می‌شوند را آسان‌تر می‌کند. روی مقدار نسبتا کمی از داده ها

با استفاده از این مدل، محققان پروتئین‌هایی با جهش‌هایی تولید کردند که پیش‌بینی می‌شد منجر به نسخه‌های بهبودیافته GFP و پروتئینی از ویروس مرتبط با آدنو (AAV) شود که برای تحویل DNA برای ژن‌درمانی استفاده می‌شود. آنها امیدوارند که بتوان از آن برای توسعه ابزارهای اضافی برای تحقیقات علوم اعصاب و کاربردهای پزشکی استفاده کرد.

طراحی پروتئین مشکل سختی است زیرا نقشه برداری از توالی DNA تا ساختار و عملکرد پروتئین واقعاً پیچیده است. ممکن است یک پروتئین بزرگ 10 تغییر در توالی وجود داشته باشد، اما هر تغییر میانی ممکن است با یک پروتئین کاملاً غیرعملکردی مطابقت داشته باشد. این مانند تلاش برای یافتن راه خود به سمت حوضه رودخانه در یک رشته کوه است، زمانی که قله های پرتگاهی در مسیر وجود دارند که جلوی دید شما را می گیرند. ایلا فیته، پروفسور مغز و علوم شناختی در MIT، عضو مؤسسه تحقیقات مغزی McGovern MIT، مدیر مرکز علوم اعصاب محاسباتی یکپارچه K. Lisa Yang و یکی از نویسندگان ارشد این مطالعه

رجینا بارزیلای، استاد ممتاز دانشکده مهندسی هوش مصنوعی و سلامت در MIT، و Tommi Jaakkola، استاد مهندسی برق و علوم کامپیوتر توماس سیبل در MIT، همچنین نویسندگان ارشد یک مقاله با دسترسی آزاد هستند. روی اثری که در کنفرانس بین المللی ارائه خواهد شد روی نمایندگی های آموزشی در ماه مه. اندرو کرجنر و جیسون ییم، دانشجویان فارغ التحصیل MIT، نویسندگان اصلی این مطالعه هستند. نویسندگان دیگر عبارتند از: شهر براچا، فوق دکترای MIT، و رامان ساموسویچ، دانشجوی کارشناسی ارشد در دانشگاه فنی چک.

بهینه سازی پروتئین ها

بسیاری از پروتئین های طبیعی دارای عملکردهایی هستند که می تواند آنها را برای تحقیقات یا کاربردهای پزشکی مفید کند، اما برای بهینه سازی آنها به کمی مهندسی بیشتر نیاز دارند. در این مطالعه، محققان در ابتدا علاقه مند به توسعه پروتئین هایی بودند که می توانند در سلول های زنده به عنوان شاخص های ولتاژ استفاده شوند. این پروتئین‌ها که توسط برخی از باکتری‌ها و جلبک‌ها تولید می‌شوند، هنگام تشخیص پتانسیل الکتریکی، نور فلورسنت ساطع می‌کنند. اگر چنین پروتئین هایی برای استفاده در سلول های پستانداران مهندسی شوند، می توانند به محققان اجازه دهند تا فعالیت نورون ها را بدون استفاده از الکترود اندازه گیری کنند.

پیشنهاد می‌کنیم بخوانید: استفاده از زبان برای درک ماشین ها

در حالی که دهه‌ها تحقیق روی مهندسی این پروتئین‌ها برای تولید سیگنال فلورسنت قوی‌تر انجام شده است. روی با یک مقیاس زمانی سریعتر، آنها به اندازه کافی برای استفاده گسترده مؤثر نیستند. براچا که در آزمایشگاه ادوارد بویدن در موسسه مک گاورن کار می کند، به آزمایشگاه فیته مراجعه کرد تا ببیند آیا آنها می توانند با هم کار کنند یا خیر. روی یک رویکرد محاسباتی که ممکن است به افزایش سرعت کمک کند process بهینه سازی پروتئین ها

فیته می‌گوید: «این کار نمونه‌ای از خوشبختی انسانی است که مشخصه بسیاری از اکتشافات علمی است. “این از خلوتگاه جمعی یانگ تان، یک نشست علمی از محققان از مراکز متعدد در MIT با ماموریت های متمایز که با حمایت مشترک K. Lisa Yang متحد شده اند، رشد کرد. ما آموختیم که برخی از علایق و ابزارهای ما در مدل‌سازی روش یادگیری و بهینه‌سازی مغز می‌تواند در حوزه کاملاً متفاوت طراحی پروتئین، همانطور که در آزمایشگاه Boyden انجام می‌شود، به کار رود.

برای هر پروتئینی که ممکن است محققان بخواهند بهینه سازی کنند، تعداد تقریباً نامتناهی از توالی های ممکن وجود دارد که می توانند با مبادله در اسیدهای آمینه مختلف در هر نقطه از توالی ایجاد شوند. با این همه تنوع ممکن، آزمایش همه آنها به صورت تجربی غیرممکن است، بنابراین محققان به مدل‌سازی محاسباتی روی آورده‌اند تا پیش‌بینی کنند که کدام یک بهترین کارایی را دارند.

در این مطالعه، محققان با استفاده از داده‌های GFP برای توسعه و آزمایش یک مدل محاسباتی که می‌تواند نسخه‌های بهتری از پروتئین را پیش‌بینی کند، بر آن چالش‌ها غلبه کردند.

آنها با آموزش یک مدل به نام شبکه عصبی کانولوشنال (CNN) شروع کردند. روی داده های تجربی متشکل از دنباله های GFP و روشنایی آنها – ویژگی که آنها می خواستند بهینه کنند.

این مدل توانست یک “منظره تناسب اندام” ایجاد کند – یک نقشه سه بعدی که تناسب پروتئین معین و تفاوت آن با دنباله اصلی را نشان می دهد. روی مقدار نسبتا کمی از داده های تجربی (از حدود 1000 نوع GFP).

این مناظر حاوی قله هایی هستند که پروتئین های مناسب تر و دره هایی را نشان می دهند که پروتئین های مناسب تری را نشان می دهند. پیش‌بینی مسیری که یک پروتئین برای رسیدن به قله‌های تناسب اندام باید طی کند می‌تواند دشوار باشد، زیرا اغلب یک پروتئین قبل از رسیدن به اوج تناسب اندام بالاتر نیاز به جهشی دارد که باعث می‌شود تناسب آن کمتر شود. برای غلبه بر این مشکل، محققان از یک تکنیک محاسباتی موجود برای “صاف کردن” چشم انداز تناسب اندام استفاده کردند.

هنگامی که این برجستگی های کوچک در چشم انداز صاف شدند، محققان مدل CNN را دوباره آموزش دادند و دریافتند که می تواند راحت تر به قله های تناسب اندام بیشتری برسد. این مدل قادر به پیش‌بینی توالی‌های بهینه‌شده GFP بود که دارای هفت آمینو اسید مختلف از توالی پروتئینی بود که با آن شروع کردند، و بهترین این پروتئین‌ها حدود 2.5 برابر مناسب‌تر از نمونه اصلی تخمین زده شد.

پیشنهاد می‌کنیم بخوانید: سادانا لولا 1403 گیتس را محقق کمبریج نامید

هنگامی که ما این منظره را داریم که نشان‌دهنده آنچه مدل فکر می‌کند نزدیک است، آن را صاف می‌کنیم و سپس مدل را دوباره آموزش می‌دهیم. روی کرجنر می‌گوید، نسخه صاف‌تر منظره. اکنون یک مسیر هموار از نقطه شروع شما به سمت بالا وجود دارد، که مدل اکنون می‌تواند با انجام اصلاحات کوچک مکرر به آن برسد. همین امر اغلب برای مناظر صاف غیرممکن است.”

اثبات مفهوم

محققان همچنین نشان دادند که این رویکرد در شناسایی توالی‌های جدید برای کپسید ویروسی ویروس مرتبط با آدنو (AAV)، یک ناقل ویروسی که معمولاً برای انتقال DNA استفاده می‌شود، به خوبی کار می‌کند. در آن صورت، آنها کپسید را برای توانایی آن در بسته بندی محموله DNA بهینه کردند.

ما از GFP و AAV به عنوان اثبات مفهوم استفاده کردیم تا نشان دهیم که این روشی است که کار می کند روی براچا می‌گوید: مجموعه داده‌هایی که به خوبی مشخص می‌شوند، و به همین دلیل، باید برای سایر مشکلات مهندسی پروتئین قابل استفاده باشند.

اکنون محققان قصد دارند از این تکنیک محاسباتی استفاده کنند روی داده هایی که براچا تولید کرده است روی پروتئین های نشانگر ولتاژ

ده‌ها آزمایشگاه در حال کار هستند روی او می‌گوید که برای دو دهه، و هنوز چیزی بهتر از این وجود ندارد. “امید این است که اکنون با تولید مجموعه داده های کوچکتر، بتوانیم مدلی را در سیلیکون آموزش دهیم و پیش بینی هایی انجام دهیم که می تواند بهتر از آزمایش دستی دو دهه گذشته باشد.”

این تحقیق تا حدی توسط بنیاد ملی علوم ایالات متحده، کنسرسیوم یادگیری ماشینی برای کشف و سنتز دارویی، کلینیک عبداللطیف جمیل برای یادگیری ماشینی در سلامت، برنامه کشف اقدامات متقابل پزشکی DTRA در برابر تهدیدات جدید و نوظهور، تامین شد. برنامه کشف مولکولی شتابدار دارپا، کمک هزینه طراحی آنتی بادی محاسباتی سانوفی، دفتر تحقیقات نیروی دریایی ایالات متحده، مؤسسه پزشکی هوارد هیوز، مؤسسه ملی بهداشت، مرکز ICoN K. Lisa Yang و K. Lisa Yang و Hock E. مرکز تان برای درمان مولکولی در MIT.

منبع: https://news.mit.edu/1403/new-computational-technique-could-help-engineer-useful-proteins-0403

برای نگارش بخشهایی از این متن ممکن است از ترجمه ماشینی یا هوش مصنوعی GPT استفاده شده باشد
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم

زمان انتشار: 1403-04-03 17:52:12

امتیاز شما به این مطلب