بررسی وکشف رونوشت های نزدیک انجمن های وب

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 712

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCCEB01_038

تاریخ نمایه سازی: 18 خرداد 1393

Abstract:

فن آوری های انجمن جستجوی فعلی قادر به شناسایی دنباله ها در مندرجات نزدیک به رونوشت (تکرار) و گروه بندی این دنباه ها در نتایج جستجو نمیباشند. در نتیجه کاربران انجمن با نتایج جستجوی رونوشت شده بار زیادی بر دوش دارند که ترجیح می دهند دنباله های جدید بدون سعی در یافتن آنچه موجود است، ایجاد کنند. بنابراین در این مقاله ما دلایل معمول را که منجر به رونوشت و ایجاد الگوریتم کشف رونوشت جدید برای دنباله های انجمن میشود را شناسایی می کنیم. این الگوریتم با استفاده از یک پژوهش بزرگ از انجمن در دنیای واقعی که بیش از یک میلیون کاربر را به خدمت گرفته است،کامل می شود. ما این کار را با الگوریتم های فعلی مشابه برای کشف رونوشت ها در صفحات وب مورد مقلیسه قرار می دهیم. نتایج اولیه ی ما نشان میدهد که ما به طور چشمگیری این الگوریتم ها را به کار گرفته ایم و ما موفق به گروه بندی دنباله های انجمن با دقت 74 درصد شده ایم.

Authors

حسن نادری

استادیار دانشگاه علم وصنعت

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • . Alexander Loser K. Muthmann, W. M. Barczy nski. Nearduplicate ...
  • . R. Kern M. Strohmaier, C. Korner. Understanding why ...
  • from an empirical study. pages 1-11, 2012. ...
  • M. Potthast and B. Stein. :New issues in near- duplicate ...
  • G. S. Manku, A.J. A. D. Sarma: TDetecting NearDuplicates for ...
  • Pamulaparty, _ Rao, D.M.S., and Rao, D.C.V.G.: :A Survey on ...
  • نمایش کامل مراجع