CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تکنیک بهینه شده تشخیص و صرف افعال در پیکره های فارسی

عنوان مقاله: تکنیک بهینه شده تشخیص و صرف افعال در پیکره های فارسی
شناسه ملی مقاله: ISCIT01_040
منتشر شده در اولین کنفرانس دانشجویی فناوری اطلاعات ایران در سال 1389
مشخصات نویسندگان مقاله:

مهدی محمدی - دانشجوی کارشناسی ارشد کامپیوتر ( هوش مصنوعی ) ،دپارتمان دانشکده فنی و م
عبدالحمید پیله ور - استادیار، دپارتمان دانشکده فنی ومهندسی دانشگاه بوعلی سینا همدان

خلاصه مقاله:
در پردازش زبانهای طبیعی و بازیابی اطلاعات متنی، استخراج ریشه واژگان و افعال از اهمیت زیادی برخوردار است. در این مقاله سعی شده است تا با بررسی روشهای مطرح برای ریشه یابی خودکار، و با استفاده از قوانین حاکم بر صرف افعال که در دستور زبان فارسی وجود دارد، تکنیکی برای تشخیص وصرف افعال فارسی طراحی گردد. تکنیک های بکار گرفته شده در پردازش زبان طبیعی NLP و text mining مانند POS برچسب زنی و همچنین در SBD مورد استفاده ق رار میگیرد . روش پیشنهاد شده در فاز اول با استفاده از بکارگیری ساختار افعال فارسی و در فاز بعدی با استفاده از یک دیکشنری بسیار کم حجم ، سعی بر ارتقاء عملکرد نتایج دارد. در گزارشات آزمایشگاهی انجام شده ، تاثیر عملکرد بیش از ۹۹ % اعلام میگردد

کلمات کلیدی:
ریشه یاب، صرف افعال فارسی، ریخت شناسی ، چندریختی ، پیکره ، رفع ابهام

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/88112/