CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی وکشف رونوشت های نزدیک انجمن های وب

عنوان مقاله: بررسی وکشف رونوشت های نزدیک انجمن های وب
شناسه ملی مقاله: NCCEB01_038
منتشر شده در همایش ملی مهندسی کامپیوتر و فناوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

حسن نادری - استادیار دانشگاه علم وصنعت
فریبا سلیمانی

خلاصه مقاله:
فن آوری های انجمن جستجوی فعلی قادر به شناسایی دنباله ها در مندرجات نزدیک به رونوشت (تکرار) و گروه بندی این دنباه ها در نتایج جستجو نمیباشند. در نتیجه کاربران انجمن با نتایج جستجوی رونوشت شده بار زیادی بر دوش دارند که ترجیح می دهند دنباله های جدید بدون سعی در یافتن آنچه موجود است، ایجاد کنند. بنابراین در این مقاله ما دلایل معمول را که منجر به رونوشت و ایجاد الگوریتم کشف رونوشت جدید برای دنباله های انجمن میشود را شناسایی می کنیم. این الگوریتم با استفاده از یک پژوهش بزرگ از انجمن در دنیای واقعی که بیش از یک میلیون کاربر را به خدمت گرفته است،کامل می شود. ما این کار را با الگوریتم های فعلی مشابه برای کشف رونوشت ها در صفحات وب مورد مقلیسه قرار می دهیم. نتایج اولیه ی ما نشان میدهد که ما به طور چشمگیری این الگوریتم ها را به کار گرفته ایم و ما موفق به گروه بندی دنباله های انجمن با دقت 74 درصد شده ایم.

کلمات کلیدی:
کشف رونوشت نزدیک ،انگشت نگاری ،گروه بندی دنباله

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/254202/