تشخیص متون محاوره از رسمی با روش های آماری

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 996

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ARGCONF03_016

تاریخ نمایه سازی: 26 مرداد 1397

Abstract:

با رایج شدن ارتباطات مجازی و رشد استفاده از شبکه های اجتماعی، حجم دادگان متنی محاوره ر شد شدیدی دا شته ا ست به طوری که چشم پوشی از این منابع غنی برای متن کاوی امری محال است. با توجه به این که اکثر ابزار های تحلیل تحلیل و بررسی پردازش زیان طبیعی برای متون رسمی قابل استفاده هستند، پیش از هر پردازشی باید این متون محاوره از رسمی جدا شوند تا به فرم استاندارد رسمی خود تبدیل شوند. در این مقاله مدلی جهت تشخیص متون محاوره از ر سمی با ترکیب روش آماری و د ستوری ارایه می شود. از آن جا که دقت روش های آماری محور، به پیکره های مورد استفاده وابسته است، نیاز به دادگان معتبر و گسترده ای وجود دارد. تمام متون و پیکره های مورد ا ستفاده و روش ساخت آن ها در این مقاله تو صیف شده و الگوریتمی برای تشخیص متون محاوره از رسمی ارایه شده است. دقت F به دست آماده الگوریتم با استفاده از پیکره های توصیفی 05,96 است.

Authors

محمد محسن خازنی

کارشناس مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

عین الله خنجری

دانشیار، دانشگاه علم و صنعت ایران

احمد اکبری

کارشناس ارشد هوش مصنوعی، آزمایشگاه پردازش متن شرکت آرمان رایان شریف