فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی
Publish place: 15th Iranian Conference on Electric Engineering
Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 11,776
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE15_078
تاریخ نمایه سازی: 17 بهمن 1385
Abstract:
در این مقاله فشرده سازی متن فارسی و تحلیل های آماری متن فارسی مورد بررسی قرار گرفته اند و دو الگوریتم معروف هافمن و حسابی از انواع و مراتب مختلف مدلها برای فشرده سازی متن فارسی پیاده سازی و از لحاظ میزان و سرعت فشرده سازی با هم مقایسه شده اند. این بررسی ها همچنین در مورد متن انگلیسی نیز انجام شده اند و نتایج آنها با هم مقایسه شده است. نتایج بدست آمده نشان می دهد که با وجود میزان فشرده سازی کمتر الگوریتم هافمن نسبت به الگوریتم حسابی (در حد 2-3 درصد) سرعت اجرای آن در حدود 40-50 برابر بیشتر از سرعت اجرای الگوریتم حسابی می باشد. همچنین این نتایج نشان می دهد که با توجه آنتروپی بالاتر متن فارسی نسبت به متن انگلیسی، متن فارسی دارای قابلیت فشرده پذیری کمتری نسبت به متن انگلیسی است. با استفاده از این نتایج برای الگوریتم حسابی وفقی طول بهینه ی هر بلوک برای کدگذاری متن با تقسیم بندی آن به بلوک های با طول ثابت، بدست آمد.
Keywords:
Authors
محسن هاشمی
دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی
محمدحسن ساوجی
دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :