از طریق منوی جستجو مطلب مورد نظر خود در وبلاگ را به سرعت پیدا کنید
یک تکنیک محاسباتی جدید میتواند مهندسی پروتئینهای مفید را آسانتر کند
برای مهندسی پروتئینهایی با عملکردهای مفید، محققان معمولاً با یک پروتئین طبیعی که عملکرد مطلوبی مانند گسیل نور فلورسنت دارد، شروع میکنند و آن را در جهشهای تصادفی زیادی قرار میدهند که در نهایت یک نسخه بهینه از پروتئین تولید میکند.
این process نسخه های بهینه بسیاری از پروتئین های مهم، از جمله پروتئین فلورسنت سبز (GFP) را به دست آورده است. با این حال، برای سایر پروتئینها، تولید یک نسخه بهینه دشوار است. محققان MIT اکنون یک رویکرد محاسباتی ایجاد کردهاند که پیشبینی جهشهایی که منجر به پروتئینهای بهتر میشوند را آسانتر میکند. روی مقدار نسبتا کمی از داده ها
با استفاده از این مدل، محققان پروتئینهایی با جهشهایی تولید کردند که پیشبینی میشد منجر به نسخههای بهبودیافته GFP و پروتئینی از ویروس مرتبط با آدنو (AAV) شود که برای تحویل DNA برای ژندرمانی استفاده میشود. آنها امیدوارند که بتوان از آن برای توسعه ابزارهای اضافی برای تحقیقات علوم اعصاب و کاربردهای پزشکی استفاده کرد.
طراحی پروتئین مشکل سختی است زیرا نقشه برداری از توالی DNA تا ساختار و عملکرد پروتئین واقعاً پیچیده است. ممکن است یک پروتئین بزرگ 10 تغییر در توالی وجود داشته باشد، اما هر تغییر میانی ممکن است با یک پروتئین کاملاً غیرعملکردی مطابقت داشته باشد. این مانند تلاش برای یافتن راه خود به سمت حوضه رودخانه در یک رشته کوه است، زمانی که قله های پرتگاهی در مسیر وجود دارند که جلوی دید شما را می گیرند. ایلا فیته، پروفسور مغز و علوم شناختی در MIT، عضو مؤسسه تحقیقات مغزی McGovern MIT، مدیر مرکز علوم اعصاب محاسباتی یکپارچه K. Lisa Yang و یکی از نویسندگان ارشد این مطالعه
رجینا بارزیلای، استاد ممتاز دانشکده مهندسی هوش مصنوعی و سلامت در MIT، و Tommi Jaakkola، استاد مهندسی برق و علوم کامپیوتر توماس سیبل در MIT، همچنین نویسندگان ارشد یک مقاله با دسترسی آزاد هستند. روی اثری که در کنفرانس بین المللی ارائه خواهد شد روی نمایندگی های آموزشی در ماه مه. اندرو کرجنر و جیسون ییم، دانشجویان فارغ التحصیل MIT، نویسندگان اصلی این مطالعه هستند. نویسندگان دیگر عبارتند از: شهر براچا، فوق دکترای MIT، و رامان ساموسویچ، دانشجوی کارشناسی ارشد در دانشگاه فنی چک.
بهینه سازی پروتئین ها
بسیاری از پروتئین های طبیعی دارای عملکردهایی هستند که می تواند آنها را برای تحقیقات یا کاربردهای پزشکی مفید کند، اما برای بهینه سازی آنها به کمی مهندسی بیشتر نیاز دارند. در این مطالعه، محققان در ابتدا علاقه مند به توسعه پروتئین هایی بودند که می توانند در سلول های زنده به عنوان شاخص های ولتاژ استفاده شوند. این پروتئینها که توسط برخی از باکتریها و جلبکها تولید میشوند، هنگام تشخیص پتانسیل الکتریکی، نور فلورسنت ساطع میکنند. اگر چنین پروتئین هایی برای استفاده در سلول های پستانداران مهندسی شوند، می توانند به محققان اجازه دهند تا فعالیت نورون ها را بدون استفاده از الکترود اندازه گیری کنند.
در حالی که دههها تحقیق روی مهندسی این پروتئینها برای تولید سیگنال فلورسنت قویتر انجام شده است. روی با یک مقیاس زمانی سریعتر، آنها به اندازه کافی برای استفاده گسترده مؤثر نیستند. براچا که در آزمایشگاه ادوارد بویدن در موسسه مک گاورن کار می کند، به آزمایشگاه فیته مراجعه کرد تا ببیند آیا آنها می توانند با هم کار کنند یا خیر. روی یک رویکرد محاسباتی که ممکن است به افزایش سرعت کمک کند process بهینه سازی پروتئین ها
فیته میگوید: «این کار نمونهای از خوشبختی انسانی است که مشخصه بسیاری از اکتشافات علمی است. “این از خلوتگاه جمعی یانگ تان، یک نشست علمی از محققان از مراکز متعدد در MIT با ماموریت های متمایز که با حمایت مشترک K. Lisa Yang متحد شده اند، رشد کرد. ما آموختیم که برخی از علایق و ابزارهای ما در مدلسازی روش یادگیری و بهینهسازی مغز میتواند در حوزه کاملاً متفاوت طراحی پروتئین، همانطور که در آزمایشگاه Boyden انجام میشود، به کار رود.
برای هر پروتئینی که ممکن است محققان بخواهند بهینه سازی کنند، تعداد تقریباً نامتناهی از توالی های ممکن وجود دارد که می توانند با مبادله در اسیدهای آمینه مختلف در هر نقطه از توالی ایجاد شوند. با این همه تنوع ممکن، آزمایش همه آنها به صورت تجربی غیرممکن است، بنابراین محققان به مدلسازی محاسباتی روی آوردهاند تا پیشبینی کنند که کدام یک بهترین کارایی را دارند.
در این مطالعه، محققان با استفاده از دادههای GFP برای توسعه و آزمایش یک مدل محاسباتی که میتواند نسخههای بهتری از پروتئین را پیشبینی کند، بر آن چالشها غلبه کردند.
آنها با آموزش یک مدل به نام شبکه عصبی کانولوشنال (CNN) شروع کردند. روی داده های تجربی متشکل از دنباله های GFP و روشنایی آنها – ویژگی که آنها می خواستند بهینه کنند.
این مدل توانست یک “منظره تناسب اندام” ایجاد کند – یک نقشه سه بعدی که تناسب پروتئین معین و تفاوت آن با دنباله اصلی را نشان می دهد. روی مقدار نسبتا کمی از داده های تجربی (از حدود 1000 نوع GFP).
این مناظر حاوی قله هایی هستند که پروتئین های مناسب تر و دره هایی را نشان می دهند که پروتئین های مناسب تری را نشان می دهند. پیشبینی مسیری که یک پروتئین برای رسیدن به قلههای تناسب اندام باید طی کند میتواند دشوار باشد، زیرا اغلب یک پروتئین قبل از رسیدن به اوج تناسب اندام بالاتر نیاز به جهشی دارد که باعث میشود تناسب آن کمتر شود. برای غلبه بر این مشکل، محققان از یک تکنیک محاسباتی موجود برای “صاف کردن” چشم انداز تناسب اندام استفاده کردند.
هنگامی که این برجستگی های کوچک در چشم انداز صاف شدند، محققان مدل CNN را دوباره آموزش دادند و دریافتند که می تواند راحت تر به قله های تناسب اندام بیشتری برسد. این مدل قادر به پیشبینی توالیهای بهینهشده GFP بود که دارای هفت آمینو اسید مختلف از توالی پروتئینی بود که با آن شروع کردند، و بهترین این پروتئینها حدود 2.5 برابر مناسبتر از نمونه اصلی تخمین زده شد.
هنگامی که ما این منظره را داریم که نشاندهنده آنچه مدل فکر میکند نزدیک است، آن را صاف میکنیم و سپس مدل را دوباره آموزش میدهیم. روی کرجنر میگوید، نسخه صافتر منظره. اکنون یک مسیر هموار از نقطه شروع شما به سمت بالا وجود دارد، که مدل اکنون میتواند با انجام اصلاحات کوچک مکرر به آن برسد. همین امر اغلب برای مناظر صاف غیرممکن است.”
اثبات مفهوم
محققان همچنین نشان دادند که این رویکرد در شناسایی توالیهای جدید برای کپسید ویروسی ویروس مرتبط با آدنو (AAV)، یک ناقل ویروسی که معمولاً برای انتقال DNA استفاده میشود، به خوبی کار میکند. در آن صورت، آنها کپسید را برای توانایی آن در بسته بندی محموله DNA بهینه کردند.
ما از GFP و AAV به عنوان اثبات مفهوم استفاده کردیم تا نشان دهیم که این روشی است که کار می کند روی براچا میگوید: مجموعه دادههایی که به خوبی مشخص میشوند، و به همین دلیل، باید برای سایر مشکلات مهندسی پروتئین قابل استفاده باشند.
اکنون محققان قصد دارند از این تکنیک محاسباتی استفاده کنند روی داده هایی که براچا تولید کرده است روی پروتئین های نشانگر ولتاژ
دهها آزمایشگاه در حال کار هستند روی او میگوید که برای دو دهه، و هنوز چیزی بهتر از این وجود ندارد. “امید این است که اکنون با تولید مجموعه داده های کوچکتر، بتوانیم مدلی را در سیلیکون آموزش دهیم و پیش بینی هایی انجام دهیم که می تواند بهتر از آزمایش دستی دو دهه گذشته باشد.”
این تحقیق تا حدی توسط بنیاد ملی علوم ایالات متحده، کنسرسیوم یادگیری ماشینی برای کشف و سنتز دارویی، کلینیک عبداللطیف جمیل برای یادگیری ماشینی در سلامت، برنامه کشف اقدامات متقابل پزشکی DTRA در برابر تهدیدات جدید و نوظهور، تامین شد. برنامه کشف مولکولی شتابدار دارپا، کمک هزینه طراحی آنتی بادی محاسباتی سانوفی، دفتر تحقیقات نیروی دریایی ایالات متحده، مؤسسه پزشکی هوارد هیوز، مؤسسه ملی بهداشت، مرکز ICoN K. Lisa Yang و K. Lisa Yang و Hock E. مرکز تان برای درمان مولکولی در MIT.
منبع: https://news.mit.edu/1403/new-computational-technique-could-help-engineer-useful-proteins-0403
لطفا در صورت وجود مشکل در متن یا مفهوم نبودن توضیحات، از طریق دکمه گزارش نوشتار یا درج نظر روی این مطلب ما را از جزییات مشکل مشاهده شده مطلع کنید تا به آن رسیدگی کنیم
زمان انتشار: 1403-04-03 17:52:12