CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارایه یک ریشه یاب کلمات فارسی، با استفاده از عبارات باقاعده

عنوان مقاله: ارایه یک ریشه یاب کلمات فارسی، با استفاده از عبارات باقاعده
شناسه ملی مقاله: ICELE03_263
منتشر شده در سومین کنفرانس بین المللی مهندسی برق در سال 1397
مشخصات نویسندگان مقاله:

علی ریحانیان - دانشجوی دکتری تخصصی هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز
محمدرضا فیضی درخشی - دانشیار گروه مهندسی کامپیوتر-هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز
علیرضا فیضی درخشی - دانشجوی کارشناسی ارشد مهندسی پزشکی، گروه مهندسی پزشکی، دانشگاه تبریز، تبریز

خلاصه مقاله:
یافتن ریشه کلمات، یکی از مهمترین موضوعات در زمینه پردازش زبان طبیعی به شمار میر ود. ریشه یک کلمه، بهبخشی از آن اطلاق میشود که پس از حذف پیشوند، پسوند و میانوند از آن، حاصل خواهد شد. در این مقاله، با به کارگیریعبارات باقاعده، یک ریشه یاب کلمات فارسی ارایه شده است که طی سه مرحله، به ریشه یابی کلمات موجود در یک پیکرهمی پردازد: 1) جداسازی کلمات موجود در پیکره، 2) اعمال قوانین ریشه یابی بر روی کلمات جداسازی شده و یافتن ریشه هاو 3) تطبیق ریشه های یافت شده با پیکرهای از مجموعه لغات زبان فارسی، به منظور رد کردن ریشه های نامعتبر. نتایجحاصل از ریشه یاب پیشنهادی، بیانگر کارایی بالای آن در ریشه یابی کلمات فارسی می باشد.

کلمات کلیدی:
پردازش زبان طبیعی، ریشه یاب، پیکره، عبارات باقاعده

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/831755/