نقدوبررسی روشهای یافتن اسنادمشابه بادرجه تشابه بالا
Publish place: First National Conference on Advances in computer science and information retrieval approaches
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 589
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_291
تاریخ نمایه سازی: 29 دی 1392
Abstract:
مسائل مختلفی درزمینه داده کاوی ازمجموعه داده های عظیم مطرح است که یکی ازآنها یافتن عناصرمشابه است موارد مختلفی رادراین مسئله میتوان به عنوان عناصردرنظرگرفت یکی ازموارد مرتبط دراین زمینه بررسی برای یافتن اسنادمشابه بادرجه تشابه بالا می باشد یعنی هدف یافتن اسنادی می باشد که تقریبا یکسان هستند مسئله پیدا کردن اسنادمشابه رامیتوان به یک مسئله برپایه ی مجموعه تبدیل کرد که این کاردرقالب روش Shingling انجام میگیرد همچنین درادامه میتوان به کمک اعضای این مجموعه ها زابررسی تمامی جفت اسنادبرای یافتن اسنادمشابه خودداری کرد وفقط اسنادی را که با احتمال بیشتری مشابه هستند بررسی نمودازجمله میتوان به روش شاخص گذاری اشاره کرد که به این صورت عمل می کند ما دراین مقاله روشهای مختلف شاخص گذاری راباپیاده سازی و مورد بررسی قراردادیم این روشها شامل شاخص گذاری براساس پیشوند موقعیت و طول پسوند می باشند درواقع هدف اصلی مقاله ارزیابی این روشها و همچنین کمک به تصمیم گیری برای انتخاب بهترین روش باتوجه به فرضهای مسائل مختلف می باشد
Keywords:
داده کاوی , Shingling/شاخص گذاری پیشوند/شاخص گذاری موقعیت/شاخص گذاری طول پسوند
Authors
معصومه قاسمی ماه سایه
کارشناسی ارشدکامپیوتر
علی مهجور
دکتری تخصصی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :