CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تولید اتوماتیک شبه-آنتولوژی به روش استخراج مفاهیم از وب

عنوان مقاله: تولید اتوماتیک شبه-آنتولوژی به روش استخراج مفاهیم از وب
شناسه ملی مقاله: ACCSI12_045
منتشر شده در دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1385
مشخصات نویسندگان مقاله:

بهرام امینی - مدرس گروه کامپیوتر، دانشگاه آزاد اسلامی واحد مبارکه ، دانشکده فنی و مهندسی
حسن ابوالحسنی - استادیار، دانشگاه صنعتی شریف، دانشکده مهندسی برق و کامپیوتر

خلاصه مقاله:
توسعه و رشد وب معنایی مشوق اصلی تولید آنتولوژی در دامنه های متفاوت میباشد. تولید آنتولوژی معمولا وقت گیر، خسته کننده، خطادار و وابسته ب ه دانش مهندس دامنه است . یکی از مشکلات اصلی در این زمینه ، دسترسی به مجموعه واژگان معتبر و کامل برای تولید آنتولوژی است . در این تحقیق با استفاده از یک روش نمونه برداری صفحات اولیه در مقیاس بزر گ و استفاده از الگوریتمهای پردازش زبان طبیعی، تحلیلهای آماری و تکنیک های بازیابی اطلاعات، یک روش اتوماتیک برای تولید شبه-آنتولوژی برای دامنه پژوهش در علوم کامپیوتر پیشنهاد شده اس ت. هدف اصلی ما تهیه اتوماتیک مجموعه بزرگی از واژگان و مفاهیم اصلی دامنه است که کار تولید آنتولوژی را سریعتر و راحتتر کند. بدین منظور صفحات مرتبط در این دامنه با استفاده از یک خزشگر تاکیدی مبتنی بر واژگان مورد استفاده قرار گرفته و با استفاده از تکنیکهای مذکور لیست کاملی از واژگان دامنه استخراج شده است. برای استفاده مجدد این روش در دامنههای دیگر، فرآیند ساخت آنتولوژی نیز تا حد ودی مستقل از دامنه پیاده س ازی شده است.

کلمات کلیدی:
آنتولوژی،یادگیری آنتولوژی، وب معنایی، خزشگر تاکید ی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/44432/