سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

بررسی جامع تکامل معماری مدل های زبانی بزرگ

Publish Year: 1403
Type: Conference paper
Language: Persian
View: 46

This Paper With 19 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

CELCONF04_074

Index date: 11 March 2025

بررسی جامع تکامل معماری مدل های زبانی بزرگ abstract

مدل های زبانی بزرگ (LLMs) به عنوان یک نقطه عطف در حوزه پردازش زبان طبیعی (NLP) و هوش مصنوعی، نقش حیاتی در توسعه فناوری های پیشرفته ایفا کرده اند. تحقیق جاری به بررسی جامع تکامل معماری مدل های زبانی بزرگ از دیدگاه تاریخی، تکنیکی و کاربردی می پردازد. در ابتدا، به پیشرفت های اولیه در معماری های یادگیری عمیق، از جمله شبکه های عصبی بازگشتی (RNNs) و شبکه های پیچشی (CNNs)، پرداخته و محدودیت های آنها در پردازش متون طولانی بررسی می شود. سپس، با تمرکز بر معرفی معماری ترنسفورمر و مدل هایی همچون BERT، GPT و خانواده های مرتبط، تاثیر این معماری بر توانایی مدل ها در درک و تولید زبان طبیعی تحلیل می شود. ضمن اینکه مسائل چالش برانگیز مدل های زبانی بزرگ مانند نیاز به داده های حجیم، مصرف منابع محاسباتی، و سوگیری الگوریتمی در این مدل ها مورد بررسی قرار می گیرد. در نهایت، روندهای نوظهور و آینده نگری در توسعه LLM ها، از جمله بهینه سازی معماری ها، کاهش منابع مصرفی، و تقویت قابلیت تفسیرپذیری این مدل ها، ارائه می شود. این مطالعه با هدف ارائه یک نمای کلی و دقیق، بستری برای درک بهتر تکامل و جهت گیری آینده مدل های زبانی بزرگ فراهم می کند.

بررسی جامع تکامل معماری مدل های زبانی بزرگ Keywords:

بررسی جامع تکامل معماری مدل های زبانی بزرگ authors

سمیرا کرامت طالتپه

گروه کامپیوتر، واحد میانه، دانشگاه آزاد اسلامی، میانه، ایران

اصغر محمدیان

گروه کامپیوتر، واحد ایلخچی، دانشگاه آزاد اسلامی، ایلخچی، ایران

پرویز قربانزاده

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فناوری های نوین، دانشگاه صنعتی، ارومیه، ایران

عهدیه قربانزاده

محقق پارک علم و فناوری، استان آذربایجان غربی، ارومیه، ایران

مقاله فارسی "بررسی جامع تکامل معماری مدل های زبانی بزرگ" توسط سمیرا کرامت طالتپه، گروه کامپیوتر، واحد میانه، دانشگاه آزاد اسلامی، میانه، ایران؛ اصغر محمدیان، گروه کامپیوتر، واحد ایلخچی، دانشگاه آزاد اسلامی، ایلخچی، ایران؛ پرویز قربانزاده، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فناوری های نوین، دانشگاه صنعتی، ارومیه، ایران؛ عهدیه قربانزاده، محقق پارک علم و فناوری، استان آذربایجان غربی، ارومیه، ایران نوشته شده و در سال 1403 پس از تایید کمیته علمی چهارمین همایش بین المللی مهندسی کامپیوتر، برق و تکنولوژی پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله مدل های زبانی بزرگ (LLMs), تکامل معماری, یادگیری عمیق, معماری ترنسفورمر هستند. این مقاله در تاریخ 21 اسفند 1403 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 46 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که مدل های زبانی بزرگ (LLMs) به عنوان یک نقطه عطف در حوزه پردازش زبان طبیعی (NLP) و هوش مصنوعی، نقش حیاتی در توسعه فناوری های پیشرفته ایفا کرده اند. تحقیق جاری به بررسی جامع تکامل معماری مدل های زبانی بزرگ از دیدگاه تاریخی، تکنیکی و کاربردی می پردازد. در ابتدا، به پیشرفت های اولیه در معماری های یادگیری عمیق، از ... . برای دانلود فایل کامل مقاله بررسی جامع تکامل معماری مدل های زبانی بزرگ با 19 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.