تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه گذاری ضرایب موجک و نرم سازی فازی تابع انرژی

غزال شیخی; حمید محمودیان

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه گذاری ضرایب موجک و نرم سازی فازی تابع انرژی

Publish place: Journal of Intelligent Procedures in Electrical Technology، Vol: 4، Issue: 15

Publish Year: 1392

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1372137

شناسه ملی سند علمی:

JR_JIPET-4-15_003

تاریخ نمایه سازی: 19 دی 1400

Abstract:

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه ای هر روز بیشتر مورد توجه قرار می گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی ارائه شده است. تحقیقات قبلی نویسندگان این مقاله، کارآیی نرم سازی فازی تابع انرژی را در مقایسه با سایر روش های به کار رفته در این زمینه نشان می دهد. در این تحقیق، پیشنهاد شده است که از روشی مشابه روش های متداول حذف نویز از گفتار به وسیله آستانه گذاری ضرایب موجک برای بهبود خطای درج مرز اضافه استفاده شود. این روند، انرژی همخوان های بی واکی را که در تابع انرژی قله های اضافه ایجاد می کنند، به شدت کاهش می دهد. نتایج نشان می دهند با استفاده همزمان از این روش و روش نرم سازی فازی تابع انرژی، خطای درج مرز اضافه در حدود %۸ کاهش می یابد؛ بدون آنکه سایر معیارهای کارآیی تحت تاثیر قرار گیرند. با استفاده از روش پیشنهادی بیش از %۹۴ از هجاها با خطایی کمتر از ۵۰ میلی ثانیه تقطیع می شوند.

Keywords:

تقطیع هجایی , تبدیل موجک , آستانه گذاری ضرایب موجک , واکه , همخوان , فیلتر فازی , انرژی زمان کوتاه

Authors

غزال شیخی

کارشناس ارشد/شرکت جویشگر ریزگستر مستقر در شهرک علمی و تحقیقاتی اصفهان

حمید محمودیان

دانشکده برق، واحد نجف آباد، دانشگاه آزاد اسلامی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Z. Hu, J. Sehalkwyk, E. Barnard, R. Cole, "Speech recognition ...
R. Cole, B. Oshika, M. Noel et al, "Labeler agreement ...
O. Ghitza, M. Sondhi, "Hidden Markove models with templates as ...
Z. Hu, E. Bernard, R. Cole, "Transition-based feature extraction within ...
M. Ostendorf, S. Roukos, "A stochastic segment model for phoneme-based ...
J. Sirigos, N. Fakotakis, G. Kokkonakis, "A hybrid syllable recognition ...
T. Nagarajan, H. A. Murthy, "Language identification using parallel syllable-like ...
S. Greenberg, "Speaking in short hand- A syllable centric perspective ...
W. Reichel, G. Ruske, "Syllable segmentation of continuous speech with ...
K. Kirchhoff, "Syllable-level desynchronization of phonetic features for speech recognition", ...
M. J. Hunt, M. Lening, P. Mermelstein, "Experiments in syllable-based ...
S. L. Wu, M. L. Shire, S. Greenberg et al, ...
R. Janakiraman, J. C. Kumar, H. A. Murthy, "Robust syllable ...
H. Tolba, M. Azmi, "Comparative experiments to evaluate the use ...
M. Bacchiani, M. Ostendorf, "Design of a speech recognition system ...
A. Ganapathiraju, J. Hamaker et al, "Syllable-based large vocabulary continuous ...
V. K. Prasad, T. Nagarajan, H. A. Murthy, "Continuous speech ...
H. N. Ting, Y. Jasmy, S. Hossein et al, "Malay ...
H. Matsu'ura, T. Nitta, S. Hirai et al, "A large ...
A. Tanaka, S. Kamiya, "A speech processing system based on ...
S. Zhang, Q. Shi, Y. Qin, "Modeling syllable-based pronunciation variation ...
N. T-Umpon, S. Chansareewittaya, S. Auephanwiriyakul, "Phoneme and tonal accent ...
W. Hu, T. Huang, B. Xu, "Study on prosodic boundary ...
D. Wang, L. Lu, H. J. Shang, "Speech segmentation without ...
F. Tamborini, "Prosodic prominence detection in speech", Proc. of Int. ...
S. Kim, "The role of prosodic cues in word segmentation ...
K. P. Li, "Automatic language identification using syllabic features", In ...
A. Noetzel, "Robust syllable segmentation of continuous speech using neural ...
P. Nel, J. D. Preez, "Automatic syllabification using hierarchical hidden ...
N. Jittiwarangkul, S. Jitapunkul et al, "Thai syllable segmentation for ...
V. K. Prasad, T. Nagarajan, H. A. Murthy, "Automatic segmentation ...
G. Sheikhi, F. Almasganj, "Segmentation of speech into syllable units ...
D.L. Donoho, "De-noising by soft thresholding", J. IEEE Trans. on ...
Y.S. Ing, N.K. Soo, K.Y. Chai, "Wavelet for speech denoising", ...
M. T. Johnson, X. Yuan, Y. Ren, "Speech signal enhancement ...
Y. Ghanbari, M. R. Karami-Mollaei, "A new approach for speech ...
G. Sheikhi, "Syllable boundary detection and analysis in Farsi connected ...
H. M. Teager, S. M. Teager, "A Phenomenological Model for ...
G. Sheikhi, F. Almasganj, "Syllable segmentation of Farsi connected speech ...
M. Bahoura, J. Rouat, "Wavelet speech enhancement based on time–scale ...
X. P. Zhang, M. D. Desai, "Adaptive denoising based on ...
S. Tabibian, B. Zamani Dehkordi et al, "A proposed wavelet ...
M. Bijankhan, M. J. Sheikhzadegan, "FARSDAT- the Farsi Spoken Language ...

نمایش کامل مراجع