فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی

محسن هاشمی; محمدحسن ساوجی

فشرده سازی متن فارسی با استفاده از الگوریتم های حسابی و هافمن و مقایسه آن با فشرده سازی متن انگلیسی

Publish place: 15th Iranian Conference on Electric Engineering

Publish Year: 1386

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/25147

شناسه ملی سند علمی:

ICEE15_078

تاریخ نمایه سازی: 17 بهمن 1385

Abstract:

در این مقاله فشرده سازی متن فارسی و تحلیل های آماری متن فارسی مورد بررسی قرار گرفته اند و دو الگوریتم معروف هافمن و حسابی از انواع و مراتب مختلف مدلها برای فشرده سازی متن فارسی پیاده سازی و از لحاظ میزان و سرعت فشرده سازی با هم مقایسه شده اند. این بررسی ها همچنین در مورد متن انگلیسی نیز انجام شده اند و نتایج آنها با هم مقایسه شده است. نتایج بدست آمده نشان می دهد که با وجود میزان فشرده سازی کمتر الگوریتم هافمن نسبت به الگوریتم حسابی (در حد 2-3 درصد) سرعت اجرای آن در حدود 40-50 برابر بیشتر از سرعت اجرای الگوریتم حسابی می باشد. همچنین این نتایج نشان می دهد که با توجه آنتروپی بالاتر متن فارسی نسبت به متن انگلیسی، متن فارسی دارای قابلیت فشرده پذیری کمتری نسبت به متن انگلیسی است. با استفاده از این نتایج برای الگوریتم حسابی وفقی طول بهینه ی هر بلوک برای کدگذاری متن با تقسیم بندی آن به بلوک های با طول ثابت، بدست آمد.

Keywords:

آنتروپی , الگوریتم حسابی , الگوریتم هافمن , فشرده سازی

Authors

محسن هاشمی

دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی

محمدحسن ساوجی

دانشکده مهندسی برق و کامپیوتر دانشگاه شهید بهشتی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

- محسن هاشمی، "کدگذاری حسابی متن و مقایسه‌ی آن با ...
C.E. Shannon, "A mathematical theory of c ofmm unications, _ ...
D.A. Huffman, "A method for construction of minimum redundancy codes, ...
J.J. Rissanen and G.G. Longdon, "Arithmetic Coding, " IBM J. ...
I.H. Witten, R.M. Neal, and J.G. Cleary, "Arithmetic coding for ...
. Howard, P.G. and Vitter, J.S, "Arithmetic coding for data ...
ZIV, J. and LEMIPEL, A. " A universal algorithm for ...
T.C. Bell, I.H. Witten, and J. Cleary, Text Compression, Prentice ...
. Amir Said, "Introduction to Arithmetic Coding _ Theory and ...

نمایش کامل مراجع