سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی

Publish Year: 1386
Type: Conference paper
Language: Persian
View: 1,758

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دانلود نمایند.

Export:

Link to this Paper:

Document National Code:

ACCSI13_178

Index date: 16 November 2007

خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی abstract

در این مقاله روش جدیدی برای خوشه بندی کلمات به منظور ساخت مدل زبانی n-gram برای زبان فارسی ارائه شده است که دران مشکل پیچیدگی روش های خودکار و سرگشتگی بالای روش های دستی به حداقل رسیده است. در این روش هر کلمه با یک بردار ویژگی نمایش داده می شود که این بردار معرف امار مقوله های نحوی مربوط به آن کلمه است. سپس بردارهای حاصل با استفاده از الگوریتم k-means خوشه بندی می شوند، پیاده سازی و آزمایش های مربوط بر روی پیکره متنی زبان فارسی که شامل حدود 10 میلیون کلمه می باشد، صورت گرفته است. نتایج بیانگر کاهش 34 درصدی در سرگشتگی و کاهش 16 درصدی در نرخ خطای بازشناسی نسبت به روش های دستی مبتنی بر مقوله های نحوی است.

خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی Keywords:

خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی authors

محمد بحرانی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

حسین صامتی

استادیار و عضو هیئت علمی دانشکده مهندسی کامپوتر دانشگاه صنعتی شریف

نازیلا حافظی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

سعیده ممتازی

آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

مقاله فارسی "خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی" توسط محمد بحرانی، آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف؛ حسین صامتی، استادیار و عضو هیئت علمی دانشکده مهندسی کامپوتر دانشگاه صنعتی شریف؛ نازیلا حافظی، آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف؛ سعیده ممتازی، آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف نوشته شده و در سال 1386 پس از تایید کمیته علمی سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله مدل n-gram ، خوشه بندی شده ، بازشناسی گفتار پیوسته ، مقوله نحوی ، پیکره متنی زبان فارسی ، خوشه بندی کلمات هستند. این مقاله در تاریخ 25 آبان 1386 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 1758 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که در این مقاله روش جدیدی برای خوشه بندی کلمات به منظور ساخت مدل زبانی n-gram برای زبان فارسی ارائه شده است که دران مشکل پیچیدگی روش های خودکار و سرگشتگی بالای روش های دستی به حداقل رسیده است. در این روش هر کلمه با یک بردار ویژگی نمایش داده می شود که این بردار معرف امار مقوله های نحوی ... . برای دانلود فایل کامل مقاله خوشه بندی خودکار کلمات بر اساس مقوله های نحوی برای سیستم های بازشناسی گفتار پیوسته فارسی با 4 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.