کاربرد یادگیری ماشین در تحلیل داده های متیلاسیون DNA با هدف تشخیص بیماریهای ژنتیکی

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 363

This Paper With 17 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

TECHSD05_153

تاریخ نمایه سازی: 25 آذر 1398

Abstract:

متیلاسیون دی ان ای پدیده ای است که وابستگی قدرتمندی با ایتلای اشخاص به سرطان دارد. بروز این پدیده در بدو تولد دلیلی برای ابتلای شخص به سرطان است. سرطان سینه بر اثر متیلاسیون، یکی از نمونه های بروز متیلاسیون در دی ا5ن ا5ی اشخاص است.مهمترین دغدغه پزشکان برای تشخیص و پیش گیری از بروز سرطان، تحلیل داد هایی است که این داده ها با استفاده از نمونه برداری جمع آوری گردیده است. از آنجایی که حجم این داده ها زیاد است و دارای ابعاد و5یژگی بسیاری هستند، بنابراین پزشکان قادر به تحلیل چنین داده هایی نخواهند بود. چراکه تحلیل این نوع داده ها برای پزشکان و متخصصین، فرایندی طاقت فرسا و غیر قابل انجام است و برای تشخیص صحیح نمونه ها، دقت و سرعت لازم است.در این تحقیق سعی داریم تا با استفاده از یادگیری ماشین و داده کاوی به تحلیل داده های متیلاسیون دی ا5ن ا5ی برای تشخیص صحیح سرطان سینه و تومور های زیرمجموعه آن، پزشکان را یاری کنیم..مدل ت4ن4ک و تجزیه اندازه تکین روش هایی هستند که در این تحقیق برای کاهش بعد مورد استفاده قرار می گیرند. پس از آنکه کاهش بعد انجام شد با دو رویکرد به تحلیل داده های متیلاسیون می گردازیم. رویکرد اول مبتنی بر یادگیری بدون نظارت است و رودکرد دوم مبتنی بر یادگیری با نظارت می باشد. هدف ما در این مقاله این است که بررسی کنیم کدام روش تحلیل داده برای افزایش دقت مناسب است در رویکرد اول از خوشه بندی کننده -kمیانگین و شبکه عصبی نگاشت خود سازمان دهنده استفاده می کنیم.این رویکرد مبتنی بر یادگیری بدون نظارت است. در رویکرد دوم از ماشین بردار پشتیبان و نزدیکترین همسایه وزن دار استفاده می کنیم. رویکرد دوم مبتنی بر یادگیری با نظارت است. پس از انجام آزمایش الگوریتم مورد استفاده رویکردها روی داده های متیلاسیون سرطان سینه، این دو رویکرد و الگوریتم های آنها از لحاظ دقت، نرخ خطا، حساسیت، صحت و دیگر موارد باهم مقایسه شده و الگوریتمی که بالاترین دقت را دارد معرفی می گردد.

Keywords:

Authors

بهروز دیندار

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه اسلامی واحد قزوین، قزوین، ایران