جلسه دفاع از پایاننامه: آقای علی سبزی نژاد، گروه مهندسی کامپیوتر- نرم افزار
خلاصه خبر: روش پویای تشخیص کمپلکسهای پروتئینی با رویکرد خوشهبندی دوگانه و با استفاده از دادههای شبکه PPI، گراف هستانشناسی ژن و TAP
چکیده: کمپلکسهای پروتئینی، ترکیبهای مولکولی کلیدی هستند که برای انجام بسیاری از عملکردهای بیولوژیک ضروری هستند. تشخیص کمپلکسهای پروتئینی برای درک عميقتر مکانیسمهای تنظيمي سلول و عملکرد سلولی بسیار مهم است. در سالهای اخیر، روشهای تجربی و آزمایشگاهی، مقدار زیادی از اطلاعات زیستی را تولید کردهاند. با توجه به مقدار زیاد این دادهها، تشخیص کمپلکسهای پروتئینی بهصورت آزمایشگاهی بسیار پرهزینه و زمانبر است، بنابراین نیاز به توسعه روشهای محاسباتی برای تشخیص کمپلکسهای پروتئینی حس میشود. در این پژوهش، رویکرد جدیدی برای تشخیص کمپلکسهای پروتئینی از شبکه PPI با استفاده از منابع دادههای بیولوژیکی مختلف مانند دادههای بیان ژن، گراف هستانشناسی ژن و دادههای TAP پیشنهاد میشود. با توجه به روش ساخت دادههای PPI و استفاده از الگوریتمهای یادگیری ماشین برای ایجاد آن، این دادهها دارای مقدار زیادی نویز میباشند. در این پژوهش، از دادههای هستانشناسی ژن و TAP برای کم کردن میزان مثبت کاذب دادههای PPI استفاده شده است. همچنین، این پژوهش با در نظر گرفتن ساختار پویای مولکولهای زیستی و استفاده از الگوریتم ژنتیک برای خوشهبندی دوگانه دادههای بیان ژن، به ساخت زیر شبکههای پویا از شبکه PPI میپردازد. نتایج نشان میدهد که روش پیشنهادی میتواند کمپلکسهای پروتئینی را دقیقتر از سایر روشهای موجود تشخیص دهد. در مجموعه داده DIP و مجموعه محک CYC2008، در بهترین حالت به بازخوانی 88.3٪ که حدود 30٪ بیشتر از روش BiCAMWI است دست پیدا کرده است. همچنین در مجموعه داده BioGrid و مجموعه محک CYC2008، روش پیشنهادی حداکثر به صحت 69.3٪ و بازخوانی ٪ 87.5 رسیده است که به ترتیب حدود 25٪ و 20٪ بیشتر از BiCAMWI که بهترین روش موجود است، میباشد. 14 بهمن 1397 / تعداد نمایش : 1754
|