بررسی روش های کشف و مقایسه الگوهای پرس و جو های مکرر در اسناد XML

فاطمه دورانی; محمدجواد کارگر

بررسی روش های کشف و مقایسه الگوهای پرس و جو های مکرر در اسناد XML

Publish place: The first computer and network technology vision conference in 2030

Publish Year: 1394

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/554275

شناسه ملی سند علمی:

MAYCOMP01_063

تاریخ نمایه سازی: 5 بهمن 1395

Abstract:

کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از داده های خام، اخیراً توجه بسیاری از محققان را به خود جلب کرده است. اغلب روش های کاوش قوانین انجمنی در مرحله اول کار خود کلیه اقلام پرتکرار را از بین تمام اقلام موجود در داده ها جستجو می کنند که این امر نیازمند خواندن مکرر کل داده ها از حافظه است. بنیان اصلی پردازش و بهینه سازی الگوهای مکرر پرس و جوهای XML بر مبنای ساختار درختی آن بنا شده است و این بدان معنی است که ساختار و محتوا در این سندها در کنار یکدیگر هستند. با افزایش چشمگیر اسناد XML اهمیت پردازش بهبود پرس و جوهای XML بیشتر به چشم می خورد. الگوریتم های زیادی برای کشف قوانین انجمنی تاکنون ارائه شده اند. بخش عمده و نسبتا زمانگیر در اکثر الگوریتم های موجود از جمله سه روش مد نظر در این پروژه (TOP-K , FP-Growth , Apriori)، جستجوی اقلام پر تکرار است. برای بهینه سازی این فرایند الگوریتم های پیشنهاد شده رویکردهای متفاوتی دارند. تلاش بسیاری از روشها بر کاهش تعداد دفعات مراجعه به حافظه جهت خواندن داده ها است .برای این منظور، بعضی روش ها با یافتن راه های مستقیم جهت به دست آوردن پشتیبانی بعضی از اقلام، از مراجعات بیهوده به حافظه خودداری می کنند. از کاراترین روشهای موجود، روش های Apriori و FP-Growth و TOP-K می باشد. در این مقاله سعی بر این شده تا با بررسی سه روش کشف الگوهای پرسوجوی مکرر، آنها را از لحاظ سه معیار اصلی سرعت، حافظه و زمان اجرا بررسی نماییم و یک مقایسه کلی درباره الگوهای پرسوجوی مکرر مطرح شده در اسناد XML داشته باشیم. نتایج حاصل از تحقیق نشان می دهد که الگوریتم Top-k در اکثر موارد بسته به پیمایش نسبت به دو الگوریتم دیگر از لحاظ معیارهای ذکر شده عملکرد بهتری دارد.

Keywords:

اسناد XML , قواعد انجمنی , الگوهای پرتکرار

Authors

فاطمه دورانی

دانشجوی کارشناسی ارشد گروه کامپیوتر، واحد میبد، دانشگاه های آزاد اسلامی، میبد ، ایران

محمدجواد کارگر

عضو هیأت علمی گروه کامپیوتر، واحد میبد، دانشگاه های آزاد اسلامی ، میبد، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Chang, Tsui-Ping, Chen, Shih-Ying, 2012, ...
Information Technology, 452-458. ...
Deshpande, Leena A, Prasad, R.S, 2013. Efficient Frequent Patter Mining ...
Li, Guoliang, Feng, Jianhua, Wang, 2009 ...
Ley. C. DBLP Computer Science Biblography, ...
mohammad, 2013, An analytical review of XML association rule mining ...
_ Mohammed mohsin, ali, 2013, mining frequent structural pattern from ...
ping Chang, shih, 2010, ...
Pyun , Gwang bum, Yun, Unil, 2014, Mining top-k frequent ...
sug gu, mi, Hee hwang .geon, Ho ryo, keun, 2007, ...
wei Li, Chao, Fang Jea, Kuen, Ping Lin, Ru, Fan, ...
Yang, L. H., M. L. Lee, et a, .2003 , ...
Yun, Unil, Shin, Hyeonil, Ho Ryu, , Keun, 2012, An ...
Yun, Unil, Ryu, Keun Ho, 2011, weighted ...

نمایش کامل مراجع