CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روشی با هدف بهبود صحت جهت حل مشکل نامهای مبهم با بکارگیری تکنیک تجمیع خوشه بندی

عنوان مقاله: ارائه روشی با هدف بهبود صحت جهت حل مشکل نامهای مبهم با بکارگیری تکنیک تجمیع خوشه بندی
شناسه ملی مقاله: CITCONF03_539
منتشر شده در سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات در سال 1394
مشخصات نویسندگان مقاله:

سید محمد مرتضوی - دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران
محمدحسین ندیمی شهرکی - دانشکده مهندسی کامپیوتر، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران

خلاصه مقاله:
با گسترش منابع دیجیتال در چند سال اخیر، وجود نامهای مبهم در این منابع به یک چالش بزرگ و بحث برانگیز تبدیل شده است. منابع دیجیتال از اهمیت فراوانی برخوردارند و امروزه به عنوان یکی از منابع مهم دانشگاهی محسوب شده و کمک شایانی به کاربران در امور جستجو و یافتن مقاله، نویسنده یا موضوع خاصی از حوزههای تحقیقات یا زیر حوزههای آن میدهد. ابهام و عدم تشخیص قطعی کارهای انجام شدهی نویسندهای خاص، باعث شده است که روشهای زیادی با متدولوژیهای مختلف جهت حل این مشکل ارائه شود که البته به دلیل تنوع در نام های افراد دنیا و عدم پوشش روشی خاص برای تمامی نام ها و رکوردهای مقاله شناسی، هنوز نیاز به بهبود صحت خوشه بندی وجود دارد. در این مقاله مدلی ارائه میگردد که با استفاده از چندین تابع اندازهگیری و روشهای خوشهبندی موثر، بتوان خوشههایی تولید نمود که با تجمیع بهینه آن ها، خوشههایی با صحت بالا ایجاد کرد. نحوه استخراج رکوردها از چندین خوشه تولید شده و تجمیع در یک خوشه با الگوگیری از تکنیک تجمیع خوشه بندی انجام می شود.

کلمات کلیدی:
نام های مبهم، منابع دیجیتال، تکنیک تجمیع خوشه بندی، توابع مشابهت

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/467110/