مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی

محمد توکلی زاده راوری

مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی

Publish place: Research on Information Science and Public Libraries، Vol: 21، Issue: 1

Publish Year: 1394

نوع سند: مقاله ژورنالی

زبان: Persian

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1462364

شناسه ملی سند علمی:

JR_PUBLIJ-21-1_002

تاریخ نمایه سازی: 22 خرداد 1401

Abstract:

هدف: به علت خاص بودن برخی از مسائل زبانی، لازم است که مدل‎‎های بومی نمایه‎سازی خودکار را با توجه به ویژگی‎های هر زبان طراحی کرد. این مدل‎ها باید به‎گونه‎ای طراحی شود که جامعیت و مانعیت نمایه‎سازی مورد توجه باشد. هدف این مقاله معرفی و سنجش توانمندی مدل دو مرحله‎ای شکاف – گلچین برای نمایه‎سازی خودکار مقالات فارسی است. ابتدا الگوریتم کار به تفصیل توضیح داده می‎شود و سپس همخوانی نتایج حاصل از این الگوریتم با کلیدواژه‎های نویسنده سنجیده خواهد شد. روش: مدل نمایه‎سازی خودکار فارسی به‎همراه توضیح مراحل و مسائل مرتبط با آن معرفی خواهد شد. ارزیابی مدل از طریق شاخص دربردارندگی انجام می شود که برای تعیین درصد همخوانی بین نمایه‎سازان مورد استفاده قرار می‎گیرد. برای این کار، میزان همخوانی اصطلاحات نمایه ای که از پیاده‎سازی الگوریتم این مدل حاصل شده‎اند، با کلیدواژه‎های نویسندگان مقالات بررسی می‎گردد. یافته ها: یافته‎ها نشان داد که در ۹۰ درصد از موارد، اصطلاحی که این مدل در یک مقاله به‎عنوان پروزن‎ترین اصطلاح تشخیص داده است، مشابه اولین کلیدواژه نویسنده آن مقاله است. در کل، بین نتایج این مدل و کلیدواژه‎های نویسندگان ۷۶ درصد همخوانی وجود داشت که در مقایسه با کارهای قبلی، قابل قبول به نظر می‎رسد. اصالت/ارزش: ارزش اولیه این کار پرداختن به نمایه‎سازی خودکار با توجه به ویژگی‎های زبان فارسی است. برای پیاده‎سازی مدل ارائه شده، فرض بر استفاده از زبان عبارات الگودار است که توسط بسیاری از زبان‎های برنامه‎نویسی پشتیبانی می‎شود و نیاز به نصب و استفاده از جدول‎های بانک اطلاعاتی را برای پردازش متن کاهش می‎دهد. همچنین، مشکل تعیین آستانه بالایی اصطلاحات اصلی را حل می‎کند. علاوه بر آن، با الگوریتمی خاص، حد پایینی را نیز تعیین می‎کند؛ به‎گونه‎ای که دیگر تعداد اصطلاحات گلچین شده به طول متن بستگی ندارد. این امکان، جامعیت و مانعیت نمایه‎سازی را تضمین می‎کند.

Keywords:

Automatic Indexing , Persian Language , Break-Cull Model. , نمایه‎سازی خودکار , زبان فارسی , مدل شکاف – گلچین.

Authors

محمد توکلی زاده راوری

Yazd University

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Anderson, J. D. & Pérez-Carballo, J. (۲۰۰۱). The Nature of ...
Barto, T. (۲۰۱۲). Assessment of Indexing Trends with Specific and ...
Giyeong, K. (۲۰۰۶). Relationship between Index Term Specificity and Relevance ...
Hooper, R. S. (۱۹۶۵). Indexer Consistency Tests: Origin, Measurement, Results, ...
Jenuwine, E. S. & Floyd, J. A. (۲۰۰۴). Comparison of ...
Jones, K. S. (۲۰۰۴). A Statistical Interpretation of Term Specificity ...
Kageura, K. & Umino, B. (۱۹۹۶). Methods of Automatic Term ...
Katz, J. (۱۹۸۸). A Reliability Indexes of Automated Perimetric Tests. ...
Lancaster, F. W. (۱۹۶۸). Evaluation of the MEDLARS Demand Search ...
Leininger, K. (۲۰۰۰). Interindexer Consistency in PsycINFO. Journal of Librarianship ...
Leonard, L. E. (۱۹۷۵). Inter-Indexer Consistency and Retrieval Effectiveness: Measurement ...
Luhn, H. P. (۱۹۵۸). The Automatic Creation of Literature Abstracts. ...
Mai, J. E. (۲۰۰۱). Semiotics and Indexing: an Analysis of ...
Maron, M. E. (۱۹۷۹). Depth of Indexing. Journal of the ...
Medelyan, O. & Witten, H. L. (۲۰۰۶). Measuring Inter-Indexer Consistency ...
Park, H. (۱۹۹۶). Inferential Representation of Science Documents. Information Processing ...
Qin, J. (۲۰۰۰). Semantic Similarities between a Keyword Database and ...
Lancaster, F. W. (۱۹۹۱). Indexing and Abstracting in Theory and ...
Raghavan, V. V. et al. (۲۰۰۴). Information Retrieval. In the ...
Salton, G.; Buckley, C. (۱۹۸۸). Term-Weighing Approaches in Automatic Text ...
Taghva, K.; Beckley, R. & Sadeh, M. (۲۰۰۳). A List ...
Tonta, Y. (۱۹۹۱). A Study of Indexing Consistency Between Library ...
Salton, G. & McGill, M. J.(۱۹۸۳). Introduction to Modern Information ...
Soergel, D. (۱۹۹۴). Indexing and Retrieval Performance: The logical evidence. ...
Vu, T.; Aw, A. T. & Zhang, M. (۲۰۰۸). Term ...
ارسطوپور، شعله و احمدی‎نسب، فاطمه (۱۳۹۰). آسیب‎شناسی زبان و خط ...
برنجیان، شاپور رضا (۱۳۹۰). ریشه‎یاب ماضی و مضارع از مصدر ...
حاجی‎زین‎العابدینی، محسن (۱۳۷۸). تحلیل و ارزیابی پایگاه اطلاعاتی کتابشناسی ملی ...
دانشکار آراسته، پویا (۱۳۸۳). نرم‎افزار تشخیص فعل در زبان فارسی. ...
مولودی، امیرسعید (۱۳۹۰). فعل مرکب و معیارهای صوری برای تشخیص ...

نمایش کامل مراجع