یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده

محسن مشکی; مرتضی آنالویی

ورود

Advanced Search Thesis

مقالات فارسی ISI کنفرانسها ژورنالها

یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده

Publish place: 2nd Joint Congress on Fuzzy and Intelligent Systems

Publish Year: 1387

نوع سند: مقاله کنفرانسی

زبان: Persian

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/204044

شناسه ملی سند علمی:

FJCFIS02_335

تاریخ نمایه سازی: 26 تیر 1392

Abstract:

در این مقاله، یک روش آماری مبتنی بر پیکره برای شناسایی واژههای به هم چسبیده معرفی شد. این روش، با استفاده از معیاراحتمال شرطی متقارن تعیین میکند که آیا یک عنصر متنی، یک واژهی کامل است یا مجموعهای از واژههای به هم چسبیده است. روشپیشنهادی روی یک مجموعهی 18000 تایی از اخبار ورزشی مورد آزمایش قرار گرفت و نتایج قابل قبولی را نشان داد. به ازای هر دوآستانهی 0,001 و 0,0001 تعداد نمونههایی که به درستی از هم جدا شدند به کل نمونههای جداشده نسبت قابل قبولی (بیش از 80 درصد در مورد نمونههای جداشده به دو بخش) را نشان داد.

Keywords:

پیکرهی متنی , تعیین مرز واژهها , باهمآیی , احتمال شرطی متقارن

Authors

محسن مشکی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران

مرتضی آنالویی

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

صنعت اتصال > چسب و رزین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/204044

شناسه ملی سند علمی:

FJCFIS02_335

تاریخ نمایه سازی: 26 تیر 1392

How to Cite to This Paper:

If you want to refer to this Paper in your research work, you can simply use the following phrase in the resources section:

مشکی، محسن و آنالویی، مرتضی،1387،یک روش آماری مبتنی بر پیکره برای جداسازی واژههای به هم چسبیده،2nd Joint Congress on Fuzzy and Intelligent Systems،Isfahan،https://civilica.com/doc/204044

Citation

مروری بر روش های خلاصه سازی خودکار متون(1394)

بر اساس سیستم تحلیلی استنادات مقالات، تاکنون برای نگارش 1 Paper استفاده شده است.

Scientometrics

The specifications of the publisher center of this Paper are as follows:

Ranking of Iran University of Science and Technology

Type of center: دانشگاه دولتی

Paper count: 26,594

In the scientometrics section of CIVILICA, you can see the scientific ranking of the Iranian academic and research centers based on the statistics of indexed articles.