CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک روش هوشمند مبتنی برویژگیهای آماری به منظور استخراج کلمات و عبارات کلیدی ازمتن

عنوان مقاله: ارائه یک روش هوشمند مبتنی برویژگیهای آماری به منظور استخراج کلمات و عبارات کلیدی ازمتن
شناسه ملی مقاله: COMCONF01_475
منتشر شده در کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:

معین معادی - دانشجوی کارشناسی ارشدرشته مهندسی فناوری اطلاعات موسسه آموزش عالی پویندگان دانش چالوس
آرش شریفی - دانشکده مهندسی برق و کامپیوتر دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
رضا طاولی - دانشجوی دکتری مهندسی نرم افزار عضو هیئت علمی تمام وقت دپارتمان ریاضی دانشگاه آزاد اسلامی واحد چالوس

خلاصه مقاله:
ازاختراع خط تاکنون نوشتار دارای جایگاه ویژه ی برای ثبت و انتقال اطلاعات درمیان انسانها بوده است امروزه با ورود ماشین ها و سیستم های پردازش متن بخش وسیعی ازاین نوشتارها درقالب دیجیتال ذخیره شده است حجم عمده ی ازاین نوشتارهای دیجیتال ساخت یافته نیستند برای استفاده بهتر و بهینه ازاین گونه نوشتارها توسط سیستم ها و ماشین ها نیاز به روشهای برای ایجادساختار یاایجادفراداده های برای این نوشتارها می باشد دراین پژوهش روشی جدید بااستفاده ازویژگی های اماری و برداررخداد کلمه درهرمتن برای استخراج کلمات کلیدی ارایه میدهیم اینروش برروی متن منفرد و بدون درنظر گرفتن دامنه موضوعی متون ا جرا میشود این پیاده سازی با مجموعه داده SemEval-2010 Task که دارای 284 متن ازمقالات استخراج شده ازکتابخانه ی دیجیتال acm و سه دسته کلمه ی کلیدی مشخص شده توسط نویسنده مشخص شده توسط خواننده و ترکیب این دو به عنوان جواب هرمقاله است و معیارهای بازیابی و دقت برای کل مجموعه داده محاسبه میشود

کلمات کلیدی:
کلمات کلیدی ، متن کاوی ، ویژگی آماری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/404575/