مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی

Publish Year: 1394
نوع سند: مقاله ژورنالی
زبان: Persian
View: 89

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_PUBLIJ-21-1_002

تاریخ نمایه سازی: 22 خرداد 1401

Abstract:

هدف: به علت خاص بودن برخی از مسائل زبانی، لازم است که مدل‎‎های بومی نمایه‎سازی خودکار را با توجه به ویژگی‎های هر زبان طراحی کرد. این مدل‎ها باید به‎گونه‎ای طراحی شود که جامعیت و مانعیت نمایه‎سازی مورد توجه باشد. هدف این مقاله معرفی و سنجش توانمندی مدل دو مرحله‎ای شکاف – گلچین برای نمایه‎سازی خودکار مقالات فارسی است. ابتدا الگوریتم کار به تفصیل توضیح داده می‎شود و سپس همخوانی نتایج حاصل از این الگوریتم با کلیدواژه‎های نویسنده سنجیده خواهد شد. روش: مدل نمایه‎سازی خودکار فارسی به‎همراه توضیح مراحل و مسائل مرتبط با آن معرفی خواهد شد. ارزیابی مدل از طریق شاخص دربردارندگی انجام می شود که برای تعیین درصد همخوانی بین نمایه‎سازان مورد استفاده قرار می‎گیرد. برای این کار، میزان همخوانی اصطلاحات نمایه ای که از پیاده‎سازی الگوریتم این مدل حاصل شده‎اند، با کلیدواژه‎های نویسندگان مقالات بررسی می‎گردد. یافته ها: یافته‎ها نشان داد که در ۹۰ درصد از موارد، اصطلاحی که این مدل در یک مقاله به‎عنوان پروزن‎ترین اصطلاح تشخیص داده است، مشابه اولین کلیدواژه نویسنده آن مقاله است. در کل، بین نتایج این مدل و کلیدواژه‎های نویسندگان ۷۶ درصد همخوانی وجود داشت که در مقایسه با کارهای قبلی، قابل قبول به نظر می‎رسد. اصالت/ارزش: ارزش اولیه این کار پرداختن به نمایه‎سازی خودکار با توجه به ویژگی‎های زبان فارسی است. برای پیاده‎سازی مدل ارائه شده، فرض بر استفاده از زبان عبارات الگودار است که توسط بسیاری از زبان‎های برنامه‎نویسی پشتیبانی می‎شود و نیاز به نصب و استفاده از جدول‎های بانک اطلاعاتی را برای پردازش متن کاهش می‎دهد. همچنین، مشکل تعیین آستانه بالایی اصطلاحات اصلی را حل می‎کند. علاوه بر آن، با الگوریتمی خاص، حد پایینی را نیز تعیین می‎کند؛ به‎گونه‎ای که دیگر تعداد اصطلاحات گلچین شده به طول متن بستگی ندارد. این امکان، جامعیت و مانعیت نمایه‎سازی را تضمین می‎کند.  

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Anderson, J. D. & Pérez-Carballo, J. (۲۰۰۱). The Nature of ...
  • Barto, T. (۲۰۱۲). Assessment of Indexing Trends with Specific and ...
  • Giyeong, K. (۲۰۰۶). Relationship between Index Term Specificity and Relevance ...
  • Hooper, R. S. (۱۹۶۵). Indexer Consistency Tests: Origin, Measurement, Results, ...
  • Jenuwine, E. S. & Floyd, J. A. (۲۰۰۴). Comparison of ...
  • Jones, K. S. (۲۰۰۴). A Statistical Interpretation of Term Specificity ...
  • Kageura, K. & Umino, B. (۱۹۹۶). Methods of Automatic Term ...
  • Katz, J. (۱۹۸۸). A Reliability Indexes of Automated Perimetric Tests. ...
  • Lancaster, F. W. (۱۹۶۸). Evaluation of the MEDLARS Demand Search ...
  • Leininger, K. (۲۰۰۰). Interindexer Consistency in PsycINFO. Journal of Librarianship ...
  • Leonard, L. E. (۱۹۷۵). Inter-Indexer Consistency and Retrieval Effectiveness: Measurement ...
  • Luhn, H. P. (۱۹۵۸). The Automatic Creation of Literature Abstracts. ...
  • Mai, J. E. (۲۰۰۱). Semiotics and Indexing: an Analysis of ...
  • Maron, M. E. (۱۹۷۹). Depth of Indexing. Journal of the ...
  • Medelyan, O. & Witten, H. L. (۲۰۰۶). Measuring Inter-Indexer Consistency ...
  • Park, H. (۱۹۹۶). Inferential Representation of Science Documents. Information Processing ...
  • Qin, J. (۲۰۰۰). Semantic Similarities between a Keyword Database and ...
  • Lancaster, F. W. (۱۹۹۱). Indexing and Abstracting in Theory and ...
  • Raghavan, V. V. et al. (۲۰۰۴). Information Retrieval. In the ...
  • Salton, G.; Buckley, C. (۱۹۸۸). Term-Weighing Approaches in Automatic Text ...
  • Taghva, K.; Beckley, R. & Sadeh, M. (۲۰۰۳). A List ...
  • Tonta, Y. (۱۹۹۱). A Study of Indexing Consistency Between Library ...
  • Salton, G. & McGill, M. J.(۱۹۸۳). Introduction to Modern Information ...
  • Soergel, D. (۱۹۹۴). Indexing and Retrieval Performance: The logical evidence. ...
  • Vu, T.; Aw, A. T. & Zhang, M. (۲۰۰۸). Term ...
  • ارسطوپور، شعله و احمدی‎نسب، فاطمه (۱۳۹۰). آسیب‎شناسی زبان و خط ...
  • برنجیان، شاپور رضا (۱۳۹۰). ریشه‎یاب ماضی و مضارع از مصدر ...
  • حاجی‎زین‎العابدینی، محسن (۱۳۷۸). تحلیل و ارزیابی پایگاه اطلاعاتی کتابشناسی ملی ...
  • دانشکار آراسته، پویا (۱۳۸۳). نرم‎افزار تشخیص فعل در زبان فارسی. ...
  • مولودی، امیرسعید (۱۳۹۰). فعل مرکب و معیارهای صوری برای تشخیص ...
  • نمایش کامل مراجع