ارائه روشی جهت ریشه یابی کلمات در زبان فارسی
عنوان مقاله: ارائه روشی جهت ریشه یابی کلمات در زبان فارسی
شناسه ملی مقاله: NCCEB01_097
منتشر شده در همایش ملی مهندسی کامپیوتر و فناوری اطلاعات در سال 1392
شناسه ملی مقاله: NCCEB01_097
منتشر شده در همایش ملی مهندسی کامپیوتر و فناوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:
دانیا تمدن - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
محمدحسین یکتایی - استادیار،دانشگاه آزاد اسلامی واحد آبادان،گروه مهندسی کامپیوتر،اهواز
ماشالله عباسی دزفولی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
خلاصه مقاله:
دانیا تمدن - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
محمدحسین یکتایی - استادیار،دانشگاه آزاد اسلامی واحد آبادان،گروه مهندسی کامپیوتر،اهواز
ماشالله عباسی دزفولی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
یکی از پیشنیازهای ضروری رسیدن به نرمافزارهای پردازش متن، الگوریتمهای ریشهیابی هستند که به بررسی ساخت واژه لغات میپردازند. هدف نهایی الگوریتمهای ریشهیابی حذف پیشوندها و پسوندهای کلمه و رسیدن به ریشه لغت است. در روشهای پیشین مانند ریشهیاب جدولی، الگوریتم ریشهیاب تشکری و الگوریتم کراوتز برای زبان فارسی یک دیکشنری شامل ریشه لغات وجود دارد و در هر مرحله پس از حذف پیشوند و یا پسوند، رشته باقیمانده در دیکشنری جستجو میشود اما در روش ارائه شده در این مقاله نیازی به نگهداری دیکشنری از اسامی جامد نیست و تنها وندهای کلمات به سیستم معرفی میگردند. از سوی دیگر در بسیاری از موارد عمل ریشهیابی کلمات بدون درنظر گرفتن نوع کلمه انجام میشود که منجر به نتایج نادرست میشوند. جهت غلبه بر مشکلات مطرح شده، در این مقاله مدلی جهت ریشهیابی کلمات در زبان فارسی با درنظر نوع کلمه معرفی خواهد گردید. نتایج حاصل از آزمایشات انجام شده، نشاندهنده افزایش درصد درستی در ریشهیابی لغات در زبان فارسی با استفاده از روش پیشنهادی در مقایسه با سایر روشهای ریشهیابی میباشد.
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/254261/