خط و خطا: بازتاب دشواری های نگارش کلمه دربازیابی اطلاعات بانک نشریات کشور (مگ ایران) abstract
خط فارسی و شیوه نگارش آن از قواعد خاصی پیروی می کند. ویژگی های منحصر بفرد این خط و چالش های مربوط به آن در بازیابی اطلاعات موتورهای جستجو و بانک های اطلاعاتی همواره دغدغه پژوهشگران حوزه بازیابی اطلاعات بوده است. در مقاله حاضر به چالش های مربوط به خط فارسی در بانک اطلاعات نشریات کشور (مگ ایران) پرداخته می شود. هدف از این پژوهش شناسایی مهمترین خطاهای نگارشی در عنوان مقاله های نشریات علمی- پژوهشی علوم انسانی به منظور ارایه راهکار برای بهینه سازی بازیابی اطلاعات این مقاله ها در موتورهای جستجو است. برای انجام پژوهش حاضر از 657 عنوان مجله در 18 موضوع علوم انسانی در بانک مورد بررسی، از نمونه گیری خوشه ای استفاده شد. در هر موضوع، برای انتخاب تعداد مجله های مورد نظر (فارسی) از شیوه انتساب متناسب استفاده شد. به این ترتیب به تعداد متناسب با هر دسته موضوعی، تعداد مشخصی مجله مورد بررسی قرار گرفت. در این مجله ها تنها عنوان های آخرین شماره بررسی شد. تحلیل عنوان های انتخابی مقاله ها به شیوه کیفی و با استفاده از روش تحلیل محتوا و انتخاب کلمه به عنوان واحد تحلیل انجام گرفت. معیار بررسی صحت واحدها، فرهنگ املایی خط فارسی و دستور خط فارسی بود که به عنوان معیار استاندارد از سوی فرهنگستان زبان و ادب فارسی به انتشار رسیده است. یافته های این بررسی نشان داد پربسامدترین اشتباهای رایج در عنوان مقاله های علمی- پژوهشی حوزه های علوم انسانی به دو دسته خطاهای مربوط به فاصله گذاری نادرست میان کلمه ها و عدم استفاده از الف همزه و واو همزه مربوط هستند. از میان حوزه های مورد بررسی، بیشترین خطا به مدیریت و ادبیات و زبان ها و کمترین خطا به ادیان و عرفان و علوم قرآن و حدیث اختصاص داشت. در پزوهش حاضر نشان داده شد که این اشتباه ها بر بازیابی مقاله ها در مگ ایران تاثیر منفی دارد و نتایج جستجو را تغییر می دهد. در پایان، راهکارهایی برای افزایش اثربخشی بازیابی اطلاعات مقاله های حوزه علوم انسانی در بانک های اطلاعاتی و موتورهای جستجو بر پایه شواهد مستخرج از تحلیل خطاهای نگارشی مقاله ها در پژوهش حاضر ارایه شده است.