پیشنهاد یک روش جدید فشرده سازی رشته های یونیکد چند زبانه

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 78

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICTI06_033

تاریخ نمایه سازی: 16 دی 1402

Abstract:

استاندارد یونیکد یا Unicode ابتدا برای زبان انگلیسی و کشورهای انگلیسی زبان ایجاد شد و در ادامه برای سایر زبانها در کشورهای مختلف دستورالعملی را تدوین نمود با دستور العمل یونیکد برای ذخیره سازی داده های چند زبانه مانند کدگذاری نویسه ها با کاراکترهای عربی و فارسی روی رایانه ها نیاز به توسعه فضایی حداقل دو بایت است. لذا ارائه روشهای موثر فشرده سازی برای متنهای چند زبانه بدلیل اهمیت فضای ارسال اطلاعات ضرورت پیدا میکند روشهای متداول فشرده سازی نظیر لغتنامه و تصادفی و هافمن میتوانند برای فشرده سازی رشته های چند زبانه به کار روند ولی متاسفانه رشته های فشرده شده با این روشها غیر قابل پردازش میشوند زیرا این روشهای فشرده سازی کلا ساختار رشته را به هم میریزند. بنابراین جستجوی یک رشته ساده در میان رشته فشرده شده با مشکل مواجه می شود. این مقاله روشی برای فشرده سازی رشته های چند زبانه یونیکد ارائه میکند که رشته های فشرده شده همچنان قابل پردازش هستند و یک رشته را می توان میان رشته فشرده شده جستجو کرد و با این شیوه برای فرستادن پیامک یا SMS که فقط ۱۴۰ بایت فضا موجود است تعداد کاراکترهای فارسی قابل انتقال از روی سامانه ها نسبت به انگلیسی به دو برابر افزایش می یابد.

Keywords:

یونیکد چند زبانه پردازش متن فشرده سازی

Authors

وحید میگلی

دکتری مهندسی برق کنترل دانشکده سیستمهای هوشمند و علوم داده دانشگاه خلیج فارس بوشهر

محسن میگلی

کارشناس ارشد مهندسی پدافند غیر عامل دانشگاه صنعتی مالک اشتر تهران

فاطمه نعمتی

دکتری زبان شناسی دانشکده ادبیات و علوم انسانی دانشگاه خلیج فارس بوشهر

حسین مهتدی

دکتری زبان و ادبیات عربی دانشکده ادبیات و علوم انسانی دانشگاه خلیج فارس بوشهر