شناسایی و استخراج الگو ی گراف هم آیی واژگان برای سور با حجم داده هم سان
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 587
This Paper With 17 Page And PDF and WORD Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IRCEM02_125
تاریخ نمایه سازی: 7 اسفند 1396
Abstract:
روند فزاینده پیشرفت های فناوری امکان تنوع بخشی به روشهای شناسایی و استخراج ویژگی های داده ها و کشف ارتباط و شیوه اندرکنش آنها در پدیده های دنیای تکوین را بیش از پیش فراهم نموده است. در سالهای اخیر، رویکرد شبکه ای بررسی متون در داده های شبکه های اجتماعی محمل تحلیل رفتاری کاربران قرار گرفته ولی پژوهش های زبان شناسی رایانه ای در این خصوص به تازگی شروع شده است. تشکیل شبکه واژگان قرآن نیز در این راستا قابل توجه است چون امکان سنجش ارتباط و میزان نقش آفرینی آنها در ساختار ظاهری داده ها را تقویت می کند. در این بررسی گراف بدون جهت کلمات هم نشین در آیات 10 سوره با حجم داده یکسان تشکیل و شاخص های مختلف مرکزیت و دانسیته آن ها استخراج گردید. ضمن استفاده از فاصله بین کلمات به عنوان معیار تفکیک واژه، هزینه خاصی برای تفاوت فاصله بین کلمات در یک آیه لحاظ نشد و وزن دهی بر اساس میزان تکرار واژه تعیین گردید. نتایج نشان داد که به منظور تقویت کارایی تحلیل موضوعی واژگان، ضرورت دارد که پیش پردازش داده ها با حذف کلمات دارای تکرار زیاد ولی بدون تاثیر در موضوع یابی از طریق پیاده سازی الگوریتم های بازیابی، انجام شود. علاوه بر این، با توجه به بالا بودن ضریب بودن هم بستگی بین بعضی از شاخص ها، استفاده از روشهای کاهش ابعاد و هم چنین شناسایی و استخراج شاخص های الگوی طیفی گراف ها پیشنهاد گردید.
Keywords:
Authors
فاطمه علی خواه
دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات دانشگاه قم
محمدکاظم مویدی
استادیار دانشکده مهندسی مکانیک دانشگاه قم
ایوب ترکیان
دانشیار انستیتو آب و انرژی دانشگاه صنعتی شریف