خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 473

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF05_695

تاریخ نمایه سازی: 21 اردیبهشت 1397

Abstract:

در عصر مهبانگ داده و مهبانگ محتوا، خلاصه سازی متن امروزه به ابزار مهمی برای ارزیابی متن و تفسیر وفهم متن تبدیل شده است. و به همین دلیل، به ابزار بسیار مهمی در تصمیم سازیهای خرد و کلان فردی و اجتماعی و نیز تولید اطلاعات و دانش کاربردی و حتی تولید علم تبدیل شده ا ست. خلا صه سازی دستی متون بسیار بزرگ برای انسان کار دشواری است. روشهای سنتی خلاصه سازی اسناد محدود به سایز اسناد هستند و قادر به خلا صه سازی اسناد کلان داده بر روی ابر نیستند. این مقاله، یک متد خلا صه سازی کلان داده پی شنهاد میدهد که از ویژگیهای معنایی استخراج شده از ماتریس فاکتورگیری نامنفی با استفاده از پردازش موازی توزیع شده در هادوپ ا ستخراج شده ا ست. نتایج تجربی به دست آمده این پژوهش نشان میدهد که متد مذبور به خوبی میتواند سایز اسناد کلان داده را با استفاده از پردازش موازی توزیع شده ی هادوپ خلاصه کند و در مقایسه با متدهای خلاصه سازی تک گرهای از ضریب دقت و بازخوانی بهتری برخوردار است.

Authors

امید یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

عطاءالله ابطحی

استادیار گروه مدیریت، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

محمود البرزی

دانشیار گروه مدیریت ، دانشکده مدیریت، واحد علوم و تحقیقات تهران ، دانشگاه آزاد اسلامی، تهران، ایران

کاوه یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران