ارایه ی یک جداساز کلمات با استفاده از عبارات باقاعده

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 773

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF05_661

تاریخ نمایه سازی: 21 اردیبهشت 1397

Abstract:

این مقاله، به ارایه و تجزیه و تحلیل یک جداساز کلمات میپردازد. این جداساز با استفاده از عبارات باقاعده به جداسازی کلمات موجود در مجموعهای از نوشته جات میپردازد. در واقع، بنیان این جداساز بر استفاده از قابلیت جایگزینی در عبارات باقاعده بنا نهاده شده است. جداساز پیشنهادی این مقاله، میتواند کلمات فارسی، انگلیسی، علایم و ... را تشخیص داده و به خوبی از عهده ی جداسازی آنها برآید. در فرایند پردازش یک متن، برخورد با عباراتی که متفاوت از حالت معمول باشند، امری اجتناب ناپذیر است. در فرایند پیادهسازی این جداساز، سعی شد که حتی الامکان، کلمات به خوبی جداسازی شده و تعداد تکرار آنها مشخص شوند. خروجی که این جداساز به یک کاربر خواهد داد، شامل متن مورد پردازش، کلمات موجود در متن به صورت جدا شده و با تکرار (Words) ، تعداد کلمات موجود در متن، کلمات موجود درمتن بدون تکرار (Vocabulary)، تعداد کلمات بدون تکرار و در نهایت لیستی شامل هر لغت به همراه تعداد تکرار آن در متن مورد نظر خواهد بود. این لیست، یکبار بر روی لغات و بار دیگر بر روی تعداد تکرار مرتب خواهد بود.

Authors

علی ریحانیان

دانشجوی دکتری تخصصی هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز

محمدرضا فیضی درخشی

دانشیار گروه مهندسی کامپیوتر-هوش مصنوعی و رباتیکز، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز

علیرضا فیضی درخشی

دانشجوی کارشناسی ارشد مهندسی پزشکی، گروه مهندسی پزشکی، دانشگاه تبریز، تبریز

میرعرفان غیبی

دانشجوی کارشناسی مهندسی کامپیوتر، گروه مهندسی کامپیوتر، دانشگاه تبریز، تبریز