خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ

امید یوسفیان هاشم آباد; عطاءالله ابطحی; محمود البرزی; کاوه یوسفیان هاشم آباد

خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ

Publish place: Fifth International Conference on Electrical and Computer Engineering with Emphasis on Indigenous Knowledge

Publish Year: 1396

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/725668

شناسه ملی سند علمی:

COMCONF05_695

تاریخ نمایه سازی: 21 اردیبهشت 1397

Abstract:

در عصر مهبانگ داده و مهبانگ محتوا، خلاصه سازی متن امروزه به ابزار مهمی برای ارزیابی متن و تفسیر وفهم متن تبدیل شده است. و به همین دلیل، به ابزار بسیار مهمی در تصمیم سازیهای خرد و کلان فردی و اجتماعی و نیز تولید اطلاعات و دانش کاربردی و حتی تولید علم تبدیل شده ا ست. خلا صه سازی دستی متون بسیار بزرگ برای انسان کار دشواری است. روشهای سنتی خلاصه سازی اسناد محدود به سایز اسناد هستند و قادر به خلا صه سازی اسناد کلان داده بر روی ابر نیستند. این مقاله، یک متد خلا صه سازی کلان داده پی شنهاد میدهد که از ویژگیهای معنایی استخراج شده از ماتریس فاکتورگیری نامنفی با استفاده از پردازش موازی توزیع شده در هادوپ ا ستخراج شده ا ست. نتایج تجربی به دست آمده این پژوهش نشان میدهد که متد مذبور به خوبی میتواند سایز اسناد کلان داده را با استفاده از پردازش موازی توزیع شده ی هادوپ خلاصه کند و در مقایسه با متدهای خلاصه سازی تک گرهای از ضریب دقت و بازخوانی بهتری برخوردار است.

Keywords:

خلاصه سازی , کلان داده , هادوپ , ویژگیهای معنایی , ماتریس فاکتورگیری نامنفی , نگاشت کاهش

Authors

امید یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

عطاءالله ابطحی

استادیار گروه مدیریت، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

محمود البرزی

دانشیار گروه مدیریت ، دانشکده مدیریت، واحد علوم و تحقیقات تهران ، دانشگاه آزاد اسلامی، تهران، ایران

کاوه یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران