CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روشی جدید برای وزن دهی واژه ها در خوشه بندی مستندات

عنوان مقاله: روشی جدید برای وزن دهی واژه ها در خوشه بندی مستندات
شناسه ملی مقاله: KMTTORBAT01_027
منتشر شده در اولین همایش ملی فناوری و مدیریت دانش با محوریت اقتصاد مقاومتی در سال 1393
مشخصات نویسندگان مقاله:

سمیه گراوند - دانشجوی ارشد موسسه آموزش عالی پویش
سیداحسان یثربی نایینی - عضو هیات علمی دانشگاه تربت حیدریه

خلاصه مقاله:
بازیابی اطلاعات فرایند یافتن اطلاعات مربوط به جستجوی کاربر در مجموعه مدارک مورد نظر می باشد .با پیاده سازی الگوریتم های متفاوت استراتژی های مختلفی در بازیابی اطلاعات وجود دارد وجه مشترک استراتژی های بازیابی ، یافتن مدارک مشابه با موضوع جستجوی کاربر است .یکی از الگوریتم های مهمی که در بازیابی اطلاعات ،کاربردبسیار دارد،الگوریتم های فضای برداری است که می کوشد تمام مدارک را در مجموعه وجستجوهای کاربربه صورت بردارها نشان دهد وضریب تشابه میان بردارها ی مدارک و بردار جستجو را جهت بازیابی مدارک مربوط محاسبه می کند.در این مقاله یک روش جدید برای وزن دهی واژه ها ارائه شده که بابررسی روش tf و tf idf و مشکلات آنها وآزمایشاتی که انجام شده روش مناسبی برای وزن دهی واژه ها می باشد.

کلمات کلیدی:
وزن دهی ،مدل فضای برداری ،tf ،tfidf

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/359045/