بازشناسی و مرتبط سازی موجودیت های نام دار در سند احادیث
Publish place: Computing Science Journal، Vol: 9، Issue: 3
Publish Year: 1403
Type: Journal paper
Language: Persian
View: 53
This Paper With 16 Page And PDF Format Ready To Download
- Certificate
- I'm the author of the paper
Export:
Document National Code:
JR_CSJI-9-3_006
Index date: 2 December 2024
بازشناسی و مرتبط سازی موجودیت های نام دار در سند احادیث abstract
مسئله بازشناسی موجودیت های نام دار در متنی از یک زبان طبیعی، این نیازمندی است که درون متن، بخش هایی که حاوی اسامی خاص هستند را پیدا کنیم. علاوه بر این، مرتبط سازی این موجودیت های نام دار عبارتست از این که برای هر اسم خاص مشخص شده درون آن متن، مقصود یا مدلول آن اسم در جهان واقع را مشخص کنیم به گونه ای که اسامی یکسان یا مشابه اما با مدلول های متفاوت، کاملا از یکدیگر متمایز شوند. در این مقاله، شیوه بازشناسی موجودیت های نام دار در سند احادیث و هم چنین مرتبط سازی این اسامی با شناسه منحصربه فرد افراد تشریح می شود. بازشناسی با استفاده از آموزش مدل پیش آموخته AraBERTv۰۲ روی دادگان CANERCorpus صورت می گیرد که با تخصیص دادگان به نسبت ۸/۰ به ۲/۰ برای دادگان آموزش و آزمون، میزان دقت (accuracy) مساوی ۹۹۰/۰ در دسته بندی صحیح کلمات متعلق به دسته اشخاص حاصل می شود.مرتبط سازی با استفاده از روش های یادگیری مبتنی بر گراف انجام می شود. با مدل کردن یک دسته از سند احادیث به صورت یک گراف (در واقع یک جنگل) که سند هر حدیث به صورت یک درخت از گره هایی است که متناظر با افراد هستند، می توان مسئله را به صورت پیش بینی برچسب برای گره ها تعریف کرد. به این ترتیب یک شبکه هم آمیخت گرافی (GCN) معرفی می شود که سعی دارد تا این برچسب را براساس شکل ظاهری افراد پیرامونی هر فرد پیش بینی کند. این شبکه می تواند با آموزش روی ۸/۰ از دادگان، به دقت میزان دقت (accuracy) مساوی ۸۵۷۰/۰ برسد.
بازشناسی و مرتبط سازی موجودیت های نام دار در سند احادیث Keywords:
علوم انسانی محاسباتی , بازشناسی موجودیت های نام دار , مرتبط سازی موجودیت های نام دار , مدل های بزرگ زبانی , شبکه های هم آمیخت گرافی
بازشناسی و مرتبط سازی موجودیت های نام دار در سند احادیث authors
محمد ایزدی
دانشیار، دانشکده مهندسی کامپیوتر- دانشگاه صنعتی شریف- تهران- ایران
عارف صادقیان
دانشجو، دانشکده مهندسی کامپیوتر- دانشگاه صنعتی شریف- تهران- ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :