تولید خودکار متن فارسی با استفاده مدل های مبتنی بر قاعده و تعبیه واژگان

Publish Year: 1400
نوع سند: مقاله ژورنالی
زبان: Persian
View: 290

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_PADSA-9-4_004

تاریخ نمایه سازی: 17 فروردین 1401

Abstract:

تولید زبان طبیعی از پردازش زبان طبیعی حاصل میشود. زبان طبیعی از یک سیستم ارائه ماشینی مانند پایگاه دانش تولید میشود. سیستمهای NLG از مدتها پیش وجود داشته اما فناوری آن به صورت ابزار تجاری اخیرا به صورت گسترده به وجود آمده است. در NLG، سیستم نیاز به تصمیمگیری در مورد چگونگی قرار دادن یک مفهوم در کلمات دارد. توانایی ایجاد متن معنی دار نقش کلیدی در بسیاری از کاربردهای پردازش زبان طبیعی مانند ترجمه ماشین، گفتار و تبدیل عکس به متن دارد. هدف این پروژه ارائه روشی برای تولید متن با استفاده از روش های هوش مصنوعی و با ساختار درست و آغازی برای تولید متن فارسی است. به عبارت دیگر در این مقاله روشی ارائه شده که قادر به تولید متن طولانی متنوع علاوه بر حفظ معنا و ساختار در زبان فارسی می­باشد. جهت پیشبرد تولید متن سعی شده از ترکیب روش­های یادگیری ماشین با مدل­های احتمالاتی، استفاده شود. در مدل پیشنهادی از مدل­های احتمالاتی برای استخراج قوانین و از Word۲vec برای برداری­سازی متن استفاده شده و سپس در فاز تولید از ترکیب این دو و فاصله کسینوسی استفاده می­شود. نتایج نشان دهنده ارائه مدلی بوده که متن تولیدی آن دارای ساختار، مفهوم و تنوع مناسب می­باشد. همچنین این مدل از نظر انسانی و پیچیدگی نیز بهینه می باشد.

Authors

امید حاجی پور

هوش مصنوعی، کامپیوتر، صنعتی امیرکبیر، تهران، ایران

سعیده سادات سدیدپور

دانشگاه صنعتی مالک اشتر، تهران، ایران