سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه

Publish Year: 1396
Type: Conference paper
Language: Persian
View: 697

This Paper With 10 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

KBEI04_190

Index date: 9 March 2019

روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه abstract

در حال حاضر با افزایش روزافزون داده ها و حجم اطلاعات در مسائل دنیای پیرامون خود روبرو هستیم که چالش روبروی ما، مدل سازی و تجزیه و تحلیل داده هاست و بهره گیری از روشهایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، جزء مراحل ضروری شناسایی داده ها به شمار می آید. داده های پرت با عدم تطابق با سایر داده ها سبب بروز مشکل در امر تجزیه و تحلیل داده ها میگردند . بنابراین لزوم شناسایی داده های پرت امری اجتناب ناپذیر است. شناسایی داده های پرت و یا خطاها نقش مهمی در کاهش، محدود کردن حجم محاسبات دارند. داده های پرت در بسیاری از علوم کامپیوتری، پزشکی و تجارت کاربرد دارد. مسئله ی دیگری که امروزه در بحث دادهکاوی وجود دارد، بحث کاهش خطا در شناسایی داده ها است. نقش شناسایی داده ی پرت و کاهش خطاها، عامل اصلی مطالعهی تکنیکهای شناسایی داده های پرت و بهبود این تکنیکها است.در این مقاله تکنیکهای شناسایی داده های پرت و معیارهای رده بندی این روشها بیان شدند. از جمله این تکنیکها میتوان به تکنیک مبتنی بر خوشه بندی، تکنیک مبتنی بر همسایگی، تکنیک مبتنی بر چگالی و تکنیک امتیازدهی اشاره کرد. در این مقاله، ما مسئله خود را در سه فاز مورد مطالعه قرار خواهیم داد. در فاز اول، روش k نزدیک ترین همسایه مورد استفاده قرارمیگیرد. در فاز دوم، به کمک الگوریتم علفهای هرز، الگوریتم k-means اجرا میگردد. در فاز سوم، پس از تشکیل خوشه ها با استفاده از روش k-means داده های پرت شناسایی شده، حذف میگردند. بطور کلی دستاوردهای اصلی این تحقیق عبارتند از: (1 ارائه ی روش اکتشافی نزدیک ترین همسایه به منظور دست یابی به بهترین جواب در مسئله. (2 ارائه ی یک روش پیوندی k-means و علف هرز به کمک روش نزدیک ترین همسایه با هدف کاهش خطا در یافتن داده های پرت. نتایج حاصل از آزمایشات انجام شده در این مقاله، نشاندهنده برتری چشمگیری روش پیشنهادی با کاهش میانگین مربعات خطا در مجموعهی داده ها میباشد.

روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه Keywords:

شناسایی داده ی پرت مبتنی بر فاصله , شناسایی داده ی پرت مبتنی بر چگالی , شناسایی داده ی پرت مبتنی بر خوشه بندی , خوشه بندی بر مبنای درخت پوشای کمینه , تخمین جستجوی k نزدیک ترین همسایه

روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه authors

بهناز فرضی

گروه کامپیوتر، واحد بوئین زهرا، دانشگاه آزاد اسلامی بوئین زهرا، ایران

حسن نادری

گروه کامپیوتر، واحد بوئین زهرا، دانشگاه آزاد اسلامی بوئین زهرا، ایران

مقاله فارسی "روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه" توسط بهناز فرضی، گروه کامپیوتر، واحد بوئین زهرا، دانشگاه آزاد اسلامی بوئین زهرا، ایران؛ حسن نادری، گروه کامپیوتر، واحد بوئین زهرا، دانشگاه آزاد اسلامی بوئین زهرا، ایران نوشته شده و در سال 1396 پس از تایید کمیته علمی چهارمین کنفرانس بین المللی مهندسی دانش بنیان و نوآوری در حوزه مهندسی کامپیوتر و برق پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله شناسایی داده ی پرت مبتنی بر فاصله، شناسایی داده ی پرت مبتنی بر چگالی، شناسایی داده ی پرت مبتنی بر خوشه بندی، خوشه بندی بر مبنای درخت پوشای کمینه، تخمین جستجوی k نزدیک ترین همسایه هستند. این مقاله در تاریخ 18 اسفند 1397 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 697 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که در حال حاضر با افزایش روزافزون داده ها و حجم اطلاعات در مسائل دنیای پیرامون خود روبرو هستیم که چالش روبروی ما، مدل سازی و تجزیه و تحلیل داده هاست و بهره گیری از روشهایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، جزء مراحل ضروری شناسایی داده ها به شمار می آید. داده های پرت ... . برای دانلود فایل کامل مقاله روشی برای بهبود شناسایی داده پرت با استفاده از تکنیک نزدیک ترین همسایه با 10 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.