CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روشی جهت ریشه یابی کلمات در زبان فارسی

عنوان مقاله: ارائه روشی جهت ریشه یابی کلمات در زبان فارسی
شناسه ملی مقاله: NCCEB01_097
منتشر شده در همایش ملی مهندسی کامپیوتر و فناوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

دانیا تمدن - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
محمدحسین یکتایی - استادیار،دانشگاه آزاد اسلامی واحد آبادان،گروه مهندسی کامپیوتر،اهواز
ماشالله عباسی دزفولی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز

خلاصه مقاله:
یکی از پیش‌نیازهای ضروری رسیدن به نرم‌افزارهای پردازش متن، الگوریتم‌های ریشه‌یابی هستند که به بررسی ساخت واژه لغات می‌پردازند. هدف نهایی الگوریتم‌های ریشه‌یابی حذف پیشوندها و پسوندهای کلمه و رسیدن به ریشه لغت است. در روش‌های پیشین مانند ریشه‌یاب جدولی، الگوریتم ریشه‌یاب تشکری و الگوریتم کراوتز برای زبان فارسی یک دیکشنری شامل ریشه لغات وجود دارد و در هر مرحله پس از حذف پیشوند و یا پسوند، رشته باقیمانده در دیکشنری جستجو می‌شود اما در روش ارائه شده در این مقاله نیازی به نگهداری دیکشنری از اسامی جامد نیست و تنها وندهای کلمات به سیستم معرفی می‌گردند. از سوی دیگر در بسیاری از موارد عمل ریشه‌یابی کلمات بدون درنظر گرفتن نوع کلمه انجام می‌شود که منجر به نتایج نادرست می‌شوند. جهت غلبه بر مشکلات مطرح شده، در این مقاله مدلی جهت ریشه‌یابی کلمات در زبان فارسی با درنظر نوع کلمه معرفی خواهد گردید. نتایج حاصل از آزمایشات انجام شده، نشان‌دهنده افزایش درصد درستی در ریشه‌یابی لغات در زبان فارسی با استفاده از روش پیشنهادی در مقایسه با سایر روش‌های ریشه‌یابی می‌باشد.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/254261/