CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روشی برای بهبود الگوریتم بهینه سازی اجتماع ذرات با استفاده از CUDA بر روی پردازنده گرافیکی

عنوان مقاله: روشی برای بهبود الگوریتم بهینه سازی اجتماع ذرات با استفاده از CUDA بر روی پردازنده گرافیکی
شناسه ملی مقاله: JR_SCJKA-8-2_001
منتشر شده در در سال 1398
مشخصات نویسندگان مقاله:

محمد پویا اکبرپور - واحد سنندج،دانشگاه آزاد اسلامی،سنندج،ایران
کیهان خام فروش - واحد سنندج،دانشگاه آزاد اسلامی،سنندج،ایران
وفا میهمی - دانشکده کامپیوتر،واحد سنندج،دانشگاه آزاد واحد سنندج

خلاصه مقاله:
همواره زمان صرف شده برای حل مسائل سنگین محاسباتی، یکی از دغدغه های برنامه نویسان کامپیوتر بوده است. الگوریتم PSO، الگوریتمی فرا ابتکاری است که به دلیل ساد گی پیاده سازی، برای حل مسائل سنگین محاسباتی استفاده می شود ولی با وجود ساد گی، این الگوریتم برای حل مسائل سنگین واقعی ناکارآمد است. از طرفی، وجود ویژگی تعاملات محلی ذرات در الگوریتم PSO، این الگوریتم را برای موازی سازی مناسب کرده است؛ از طرف دیگر، NVIDIA با اختراع پردازنده گرافیکی و معرفی معماری CUDA، تحولات بنیادی را در حل این نوع مسائل، از طریق پیاده سازی آن بر روی پردازنده گرافیکی ایجاد کرده است. با وجود تمام تحقیقات انجام گرفته در زمینه پیاده سازی، برخی از جنبه های تکنیکی موازی سازی به منظور پیاده سازی الگوریتم به صورتی که تسریع و بازدهی مناسب بر روی تمام پردازنده های گرافیکی NVIDIA را داشته باشد، رعایت نشده است. در این مقاله سعی شده با انتخاب Geforce GT ۵۲۵M که پردازنده گرافیکی نسبتا ضعیفی است، جنبه مقیاس پذیری روش پیشنهادی رعایت شود؛ به طوری که با رسیدن به بیشینه تسریع الگوریتم پیاده سازی شده بر روی این پردازنده، به بازدهی قابل قبول برای اجرا بر روی سایر پردازنده های گرافیکی رسید. برای نیل به این هدف، از مدل چند کرنلی ارائه شده استفاده شده است. نتایج حاصل از انجام آزمایش ها رسیدن به بیشینه تسریع ۱۵/۹۸ برای حل تابع Rastrigin را نشان می دهد.

کلمات کلیدی:
موازی سازی الگوریتم, بهینه سازی اجتماع ذرات, Fermi, GPU Computing, HPC, CUDA

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1487185/