طراحی پپتیدهای ضدباکتریایی با استفاده از روشهای یادگیری ماشین جمعی

فاطمه ابراهیمی ترکی; سمیه دباغ صادق پور; محبوبه ضرابی

طراحی پپتیدهای ضدباکتریایی با استفاده از روشهای یادگیری ماشین جمعی

Publish place: 21th National & 9th International Congress on Biology

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

نسخه کامل این Paper ارائه نشده است و در دسترس نمی باشد

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری ماشین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1260271

شناسه ملی سند علمی:

BIOCONF21_0301

تاریخ نمایه سازی: 7 شهریور 1400

Abstract:

مقاومتهای آنتی بیوتیکی چالش بزرگی ا ست. پپتیدهای ضدمیکروبی غشای سلول را هدف قرار میدهند و غالبا، یک هدف خاص پروتئینی ندارند، احتمال ایجاد مقاومت در برابر اینها توسط باکتریها، پائین است.آنالیزهای آماری و الگوریتم های یادگیری ماشین اخیرا مورد توجه قرار گرفتهاند. تکنیکهای یادگیری تجمیعی در یادگیری ماشین از تلفیق چند مدل برای ارائه ی مدل بهینه به منظور پیشگویی و طبقه بندی دادها استفاده میکند. از الگوریتم های پرکاربرد در این زمینه میتوان به الگوریتمهای Bagging، Adaboost و RandomForest با تخمینگرهای متعدد، اشاره کرد. در این پژوهش به منظور پیشگویی پپتیدهایی با عملکرد اختصاصی ضد باکتریایی، داده ها از DRAMP ۲.۰ استخراج شد. روشهای EDA با استفاده از کتابخانه های seaborn، numpy و pandas پایتون انجام شد. ۵۵۴ توالی با عملکرد ضدباکتری و ۶۲۶ توالی فاقد این عملکرد فراهم شدند. توصیف کننده ها برمبنای ویژگیهای بیوفیزیکی پپتیدها ازجمله طول توالی، وزن مولکولی، بار، چگالی بار، pI، ضریب ناپایداری، آروماتی سیته، ضریب آلیفاتیک، ضریب Boman و میزان آبگریزی تعیین شدند. مدلسازی توسط الگوریتم SVM با توابع Kernel خطی، چند جمله ای با درجه ۵ و RBF یا میزان گامای ۳ و الگوریتم های RandomForest با تعداد درخت ۱۰۰وBagging Classifier ۱۰۰۰ و Adaboost با تعداد تخمین گرهای ۱۰۰ و ۱۰۰۰ انجام شد. صحت و دقت مدل ساخته شده با استفاده از الگوریتم RandomForest با تعداد تخمینگر ۱۰۰۰، %۸۷ و %۹۰ و بهینه ترین حالت در مقایسه با روشهای دیگر بود. میانگین صحت و دقت برای روشهای SVM با Kernelهای اشاره شده، Bagging و Adaboost به ترتیب برابر بود با %۷۸، %۸۷ و .%۸۶ برای داده ها و مشخصه های این پژوهش، رویکرد تجمیعی به دلیل نحوه ی استفاده از داده های train در حالت کلی در مقایسه با روش SVM نتیجه بهتری داشت.داده ها به صورت تصادفی تقسیم بندی شده و چندین بار برای یادگیری مدل استفاده شدند.با وجود پیشرفت روشهای محاسباتی نیاز به روشهای آزمایشگاهی به منظور ارزیابی های دقیق تر وجود دارد که این مرحله از گامهای آتی این پژوهش است.

Keywords:

مقاومت آنتی بیوتیکی , EDA , الگوریتم SVM , Random Forest , پپتید

Authors

فاطمه ابراهیمی ترکی

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران

سمیه دباغ صادق پور

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران

محبوبه ضرابی

آزمایشگاه زیست شناسی محاسباتی، گروه بیوتکنولوژی، دانشکده علوم زیستی، دانشگاه الزهرا تهران