نقدوبررسی روشهای یافتن اسنادمشابه بادرجه تشابه بالا

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 532

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

BPJ01_291

تاریخ نمایه سازی: 29 دی 1392

Abstract:

مسائل مختلفی درزمینه داده کاوی ازمجموعه داده های عظیم مطرح است که یکی ازآنها یافتن عناصرمشابه است موارد مختلفی رادراین مسئله میتوان به عنوان عناصردرنظرگرفت یکی ازموارد مرتبط دراین زمینه بررسی برای یافتن اسنادمشابه بادرجه تشابه بالا می باشد یعنی هدف یافتن اسنادی می باشد که تقریبا یکسان هستند مسئله پیدا کردن اسنادمشابه رامیتوان به یک مسئله برپایه ی مجموعه تبدیل کرد که این کاردرقالب روش Shingling انجام میگیرد همچنین درادامه میتوان به کمک اعضای این مجموعه ها زابررسی تمامی جفت اسنادبرای یافتن اسنادمشابه خودداری کرد وفقط اسنادی را که با احتمال بیشتری مشابه هستند بررسی نمودازجمله میتوان به روش شاخص گذاری اشاره کرد که به این صورت عمل می کند ما دراین مقاله روشهای مختلف شاخص گذاری راباپیاده سازی و مورد بررسی قراردادیم این روشها شامل شاخص گذاری براساس پیشوند موقعیت و طول پسوند می باشند درواقع هدف اصلی مقاله ارزیابی این روشها و همچنین کمک به تصمیم گیری برای انتخاب بهترین روش باتوجه به فرضهای مسائل مختلف می باشد

Keywords:

داده کاوی , Shingling/شاخص گذاری پیشوند/شاخص گذاری موقعیت/شاخص گذاری طول پسوند

Authors

معصومه قاسمی ماه سایه

کارشناسی ارشدکامپیوتر

علی مهجور

دکتری تخصصی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • S.Mitra, S.K.Pal and P.Mitra; "Data mining in soft computing framework: ...
  • _ Manber; "Finding similar files in a large file system", ...
  • S.Brin; "Near neighbor search _ large metric spaces, Department of ...
  • _ _ _ _ _ Similarity Team, 2008. ...
  • Rajaraman.A, D.Ullman.J; Mining of Massive Datasets, Cambridge Univ Pr, 2011. ...
  • Chaudhuri, S. and Ganti, V. and Kaushik, R., "A primitive ...
  • Xiao, C. and Wang, W. and Lin, X. and Yu, ...
  • نمایش کامل مراجع