ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک

سامان باشباغی; مصطفی پرچمی; حسن ختنلو; حسن بشیری

ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک

Publish place: National conference of Electronic City

Publish Year: 1390

Type: Conference paper

Language: Persian

This Paper With 5 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

https://civilica.com/doc/152722

Document National Code:

IAUHNCEC01_063

Index date: 8 July 2012

ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک abstract

دسته بندی یا طبقه بندی متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بندی های موضوعی حاصل از مجموعه های از قبل مشخص شده می باشد. دسته بندی خودکار متون و انتساب اسناد به دسته های از پیش تعیین شده، در ده سال اخیر توجهات زیادی را به سوی خود جلب کرده است. این مسأله به خاطر رشد سریع متون الکترونیکی و مسأله نیاز به دسترسی اسناد، مدارک و مقالات علمی، صفحات وب، نامه های الکترونیکی و کتابخانه های دیجیتال بوده است. در این تحقیق برای پیاده سازی دسته بند خودکار برای متون فارسی، از الگوریتم K-NN که از روشهای یادگیری با ناظر است به منظور دسته بندی متون و اسناد شهر الکترونیک استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندی، مجموعه اسناد فارسی پیکره همشهری به عنوان مجموعه های آموزشی و آزمایشی بکار رفته است. نتایج آزمایشات که با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالای روش دارد.

ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک Keywords:

دسته بندی متن , شاخص گذاری متن , شهر الکترونیک و الگوریتم K نزدیکترین همسایه

ایجاد یک طبقه بند خودکار متون زبان فارسی به منظور استفاده در کتابخانه های دیجیتال شهر الکترونیک authors

سامان باشباغی

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا

مصطفی پرچمی

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه بوعلی سینا

حسن ختنلو

استادیار دانشگاه، عضو هیئت علمی دانشگاه بوعلی سینا

حسن بشیری

عضو هیئت علمی دانشگاه صنعتی همدان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Helmot Berger, Dieter Merkl, A Comparison of Text Categorization Method, ...

Peter Nather, Text Categorization, Diploma thesis, 2005. ...

Bahareh Bina, Masoud Rahgozar, Azin Dehmoubad, Automathic Text Classification, Kish ...

Hadi Amiri, Abolfazl AleAhmad, Farhad Oroumchian, Caro Lucas, Masoud Rahgozar, ...

Workshop _ Computational Approaches to Arabic Languages, LSA 2007. ...

Abolfazl AleAhmad, Parisa Hakimi, Farzad Mahdikhani and Farhad Oroumchian, N-Gram ...

Alireza Mokhtaripour, Saber Jahani, "Introduction to a new Farsi Stemmer", ...

W.B.Canvar and J.M.Trenkle, Text Categorization, Proceedings of 3nd Anmut Symposium ...

http ://ece. ut. _ _ ir/DB RG/Ham shahri/fa. htm ...

Kjersty Aas, Line Eikvil, Text Categorization, A Survey, ...

SHI Yong-feng, ZHAO Yan-ping, School of Management & Economic, Beijing ...

Laila Khreisat, Report of Arabic Text Classification, Tech Fairleigh Dickinson ...

Fabriz Sebastiani, Machine Learning in Text Categorization, 2002. ...

Li Baoli، Yu Shiwen and Lu Qin Proceedings of the ...

Ufuk Ilhan, M.S. Thesis, Report of Text Categorization, 2001. ...

نمایش کامل مراجع