کاربست الگوریتم تخصیص دیریکله پنهان با تنظیم بهینه پارامترها دراستخراج کلمات خبر محور از میکروبلاگ ها
Publish place: The Second National Conference on Computer Engineering and Information Technology, Payame Noor University
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,025
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FNCEITPNU02_018
تاریخ نمایه سازی: 19 اردیبهشت 1395
Abstract:
میکروبلاگ در مقایسه با اسناد خوش ساختار مانند صفحات وب، مقالات خبری و بلاگها یک نوع کاملا متفاوت از متن است که کوتاه و نویزی بوده و این خصوصیات, جمع آوری اطلاعات زمینهای و آماری را برای شناسایی موضوعات مورد نظر سختتر میکند. این پژوهش جنبههای زیر را برای شناسایی اخبار از میکروبلاگها پوشش میدهد: ابتدا خصوصیات متفاوت مانند محتویات، زمینه و فعالیتهای توییتر، از میکروبلاگ بررسی شده و سپس یک مدل تشخیص موضوع با استفاده از تکنیکهای کاوش داده و الگوریتم تخصیص دریکله پنهان ایجاد شده است. در این پژوهش، مدل-سازی کاوش و استخراج متن های کوتاه و شناسایی موضوعات خبری در میکروبلاگ ها بررسی و نحوه کاربست الگوریتم تخصیص دیریلکه پنهان و تنظیم پارامترهای آن با پیاده سازی مدل معرفی شد و در زبان R نشان داده شده است.
Keywords:
Authors
حسین پورحیدر توچاهی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار دانشگاه آزاد اسلامی واحد رشت
فاطمه احمدی آبکناری
استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور رشت
رضا ابراهیمی آتانی
استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشکده ی فنی دانشگاه گیلان