شناسایی نویسنده با استفاده از مدل سازی زبانی ساده در پایگاه داده های متفاوت با ویژگی های متفاوت
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 639
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIKT08_078
تاریخ نمایه سازی: 5 بهمن 1395
Abstract:
در این مقاله به بررسی روش مدلسازی زبانی ساده برای حل مساله تخصیص نویسنده در حالت مجموعه بسته و بررسی تاثیر ویژگی هایی مثل متعادلبودن و اندازه داده آموزشی و آزمایشی در سه پایگاه داده با ویژگی های متفاوت پرداخته شده است. برای سنجش میزان دقت مدل از سه پایگاه داده متفاوتدر زبان، سبک نگارش و اندازه داده آموزشی استفاده شده است. دو پایگاه داده در زبان فارسی و به صورت نظم و یک پایگاه داده در زبان انگلیسی و بهصورت نثر تهیه شده است. برای سنجش میزان دقت از سه معیار اندازه گیری Precision, Recall و F-measure استفاده شده است. میانگین دقتحاصل در پایگاه داده های فارسی به ترتیب 60 % و 87 % و دقت در پایگاه داده انگلیسی 96 % گزارش شده است. با توجه به تشابه دو پایگاه داده اول درزبان و سبک نوشتاری و وجود اختلاف در نتایج و همچنین بهبود نتیجه در پایگاه داده سوم می توان نتیجه گرفت که متعادل بودن پایگاه داده و اندازهداده آموزشی و ازمایشی در بهبود نتایج تاثیر گذار است.
Keywords:
Authors
سمانه وزیریان
دانشجوی کارشناسی ارشد هوش مصنوعی دانشکده مجازی دانشگاه صنعتی شاهرود
مرتضی زاهدی
استادیار دانشگاه صنعتی شاهرود
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :