Year: 1400
Publish place: 7th International Web Research Conference
COI: IRANWEB07_019
Language: PersianView: 717
This Paper With 10 Page And PDF Format Ready To Download
با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این Paper را که دارای 10 صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:
Authors
Abstract:
با توجه به گسترش محتوا در بسترهای رسانهای و ارتباطی مختلف و همچنین دسترسی کاربران به این امکانات، لزوم بررسی محتوای به اشتراک گذاشته شده به ویژه در ابعاد فرهنگی و اجتماعی به منظور ارائه داده های با کیفیت به افراد حاضر در این عرصه ها همواره احساس میشود. یکی از مسائلی که در محتوای متنی، به خصوص محتوای ویژه کودکان، فرهنگی، دانشگاهی و ... بسیار پر اهمیت است تشخیص متون توهین آمیز به کار برده شده است که در این مقاله به آن پرداخته میشود. با استفاده از یادگیری ماشین SVM)، Naïve Bayes و (KNN داده های پیش پردازش شده را به مدل مورد نظر آموزش میدهیم و انتظار داریم که خروجی مدلی باشد که با دریافت متن احتمال رکیک بودن محتوا را تشخیص دهد. داده های مورد نظر مجموعه ای از جستجو های انجام شده در یک موتور جستجوی فارسی هستند که به منظور افزایش محتوا، دوباره این عبارات را در گوگل جستجو کرده و صفحه اول نتیجه را به داده ها اضافه می کنیم. سپس تشخیص میدهیم که داده مورد نظر رکیک میباشد یا خیر (برچسب گذاری). مدل مورد نظر این داده ها را یادگیری کرده و پس از آن مدلی داریم که میتواند احتمال رکیک بودن داده ورودی را تشخیص دهد. نتایج بدستآمده نشان میدهد که معیار اندازه گیری صحت (Precision) در مدل های Naïve Bayes، SVM و KNN به ترتیب برابر با ۹۴.۰۵ ، ۹۷.۲۸ و ۸۶.۴۸ خواهد بود.
Keywords:
Paper COI Code
This Paper COI Code is IRANWEB07_019. Also You can use the following address to link to this article. This link is permanent and is used as an article registration confirmation in the Civilica reference:https://civilica.com/doc/1236901/
How to Cite to This Paper:
If you want to refer to this Paper in your research work, you can simply use the following phrase in the resources section:سیفی، نیما و امینیان، مهدی،1400،تشخیص متون توهین آمیز در موتورهای جستجو با استفاده از یادگیری ماشین،7th International Web Research Conference،Tehran،https://civilica.com/doc/1236901
Research Info Management
اطلاعات استنادی این Paper را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.
Scientometrics
The specifications of the publisher center of this Paper are as follows:
In the scientometrics section of CIVILICA, you can see the scientific ranking of the Iranian academic and research centers based on the statistics of indexed articles.
New Papers
- شبیه سازی فرآیند شکل دهی کلینچ در ورق های فلزی و آلومینیومی به روش المان محدود
- Algorithmic designing of the Intake valve and Exhaust valve based on empirical formula by Catia software on Thunder ۰۹ vehicle
- شناسایی مهمترین مولفه های هوشمندسازی در مراکز اقامتی گردشگری (راهنمای جامع جهت افزایش رضایت و جذب گردشگران)
- بررسی الگوریتم های فراابتکاری و نقش آفرینی موثر آنها در سرویس ترکیبی سازمانی
- الگوریتم زمانبندی کارهای چند منظوره برای بهینه سازی خروجی به هنگام محاسبات ابری
This Papers recently indexed in civilica
Share this page
More information about COI
COI stands for "CIVILICA Object Identifier". COI is the unique code assigned to articles of Iranian conferences and journals when indexing on the CIVILICA citation database.
The COI is the national code of documents indexed in CIVILICA and is a unique and permanent code. it can always be cited and tracked and assumed as registration confirmation ID.