Raha Hasanabadi
35 یادداشت منتشر شدهبهینه سازی ثبت دسته بندی کالا در مارکت پلیس ها با کمک مدل های طبقه بندی مبتنی بر NLP
چکیده
گسترش روزافزون پلتفرم های تجارت الکترونیک و مارکت پلیس ها، حجم عظیمی از داده های مرتبط با کالاها را به همراه داشته است. یکی از چالش های اساسی در این پلتفرم ها، ثبت دقیق و سریع دسته بندی کالاها توسط فروشندگان است. دسته بندی اشتباه نه تنها تجربه کاربری را کاهش می دهد، بلکه بر موتورهای جستجو و سیستم های توصیه گر نیز تاثیر منفی می گذارد. هدف این پژوهش، ارائه یک رویکرد مبتنی بر پردازش زبان طبیعی (NLP) برای خودکارسازی و بهینه سازی فرآیند دسته بندی کالاها در مارکت پلیس های ایرانی است. در این تحقیق کاربردی، از مجموعه داده ای شامل ۱۰۰ هزار عنوان و توضیحات کالا از پلتفرم های تجارت الکترونیک استفاده شده است. پس از پیش پردازش داده های متنی به زبان فارسی، مدل های مختلف یادگیری ماشین و یادگیری عمیق از جمله ماشین بردار پشتیبان (SVM)، FastText و مدل زبانی از پیش آموزش دیده ParsBERT پیاده سازی و مقایسه شدند. نتایج نشان می دهد که مدل مبتنی بر ParsBERT با دقت (Accuracy) معادل 94.2%94.2\%94.2% و امتیاز اف-یک (F1−ScoreF1-ScoreF1−Score) برابر با 93.8%93.8\%93.8%، عملکرد بهتری نسبت به سایر مدل ها دارد. استقرار این مدل در سیستم ثبت کالای مارکت پلیس ها می تواند زمان ثبت کالا را به میزان قابل توجهی کاهش داده و خطای انسانی را به حداقل برساند.
کلیدواژه ها: تجارت الکترونیک، مارکت پلیس، پردازش زبان طبیعی (NLP)، طبقه بندی متن، یادگیری عمیق، ParsBERT.
۱. مقدمه
اهمیت موضوع:
در عصر دیجیتال حاضر، مارکت پلیس ها (Marketplaces) به عنوان بسترهای اصلی تجارت الکترونیک، نقش محوری در اقتصاد ایفا می کنند. با افزایش تعداد فروشندگان (Sellers) و تنوع بی نظیر محصولات، مدیریت کاتالوگ محصولات به یک چالش لجستیکی و داده ای تبدیل شده است. یکی از ارکان اصلی مدیریت کاتالوگ، تخصیص صحیح هر کالا به یک گره خاص در درخت دسته بندی (Taxonomy) مارکت پلیس است.
تعریف مسئله:
فرآیند فعلی ثبت کالا در بسیاری از پلتفرم ها به صورت دستی انجام می شود؛ به این معنا که فروشنده باید از میان صدها یا هزاران دسته بندی موجود، دسته مناسب را برای کالای خود انتخاب کند. این فرآیند زمان بر بوده و غالبا با خطای انسانی همراه است. انتخاب دسته بندی نادرست منجر به عدم نمایش کالا در جستجوی کاربران، افت فروش فروشنده و کاهش رضایت مشتری (Customer Experience) می شود.
بیان شکاف پژوهشی:
اگرچه تحقیقات متعددی در زمینه طبقه بندی متون در زبان انگلیسی و سایر زبان های پرکاربرد انجام شده است، اما زبان فارسی به دلیل پیچیدگی های ساختاری، وجود کلمات مرکب، فاصله های مجازی (Half-spaces) و نگارش های چندگانه، نیازمند ابزارها و مدل های بومی سازی شده است. بیشتر تحقیقات پیشین در ایران محدود به تحلیل احساسات یا دسته بندی اخبار بوده و پژوهش های جامعی در خصوص طبقه بندی عناوین کوتاه و پر از اصطلاحات تخصصی کالاها (Short-text Classification in E-commerce) با استفاده از مدل های نوین مبتنی بر ترانسفورمر (Transformers) کمتر صورت گرفته است.
هدف تحقیق:
هدف اصلی این پژوهش، توسعه و ارزیابی یک مدل طبقه بندی خودکار مبتنی بر پردازش زبان طبیعی است که بتواند با دریافت عنوان و توضیحات کوتاه کالا، دسته بندی صحیح آن را با دقت بالا پیش بینی کند تا فرآیند ثبت کالا (Onboarding) در مارکت پلیس ها بهینه سازی شود.
۲. مرور ادبیات و پیشینه پژوهش
در سال های اخیر، استفاده از تکنیک های هوش مصنوعی برای ساماندهی داده های تجارت الکترونیک مورد توجه محققان قرار گرفته است:
۱. (Chen et al., 2019): در پژوهشی به بررسی طبقه بندی محصولات در پلتفرم آمازون پرداختند. آن ها از شبکه های عصبی پیچشی (CNN) برای استخراج ویژگی از عناوین محصولات استفاده کردند و نشان دادند که مدل های عمیق نسبت به روش های سنتی مانند Naive Bayes عملکرد بسیار بهتری دارند.
۲. (Das et al., 2020): مدلی ترکیبی از FastText و TF-IDF برای طبقه بندی کالاهای فروشگاه های آنلاین ارائه دادند. نتیجه کار آن ها نشان داد که نمایش کلمات در فضای برداری پیوسته (Word Embeddings) می تواند مشکل پراکندگی داده ها (Data Sparsity) در متون کوتاه کالاها را حل کند.
۳. (Farahani et al., 2021): با معرفی ParsBERT به عنوان یک مدل زبانی مبتنی بر معماری BERT برای زبان فارسی، تحولی در پردازش متون فارسی ایجاد کردند. این مدل در وظایف مختلف پردازش زبان طبیعی از جمله طبقه بندی متون، نتایج درخشانی (F1>90%F1 > 90\%F1>90%) ثبت کرد.
۴. (Liu & Zhang, 2022): پژوهشی در زمینه استفاده از یادگیری چندوجهی (Multimodal Learning) انجام دادند که در آن علاوه بر متن، از تصاویر کالاها نیز برای طبقه بندی در مارکت پلیس علی بابا استفاده شد که دقت پیش بینی را تا حد زیادی ارتقا داد.
۵. (Zare & Hosseini, 2023): در مطالعه ای داخلی، تاثیر پیش پردازش های مبتنی بر ریشه یابی و حذف کلمات توقف را بر روی الگوریتم های سنتی ماشین بردار پشتیبان (SVM) و جنگل تصادفی بررسی کردند. نتایج آن ها حاکی از وابستگی شدید الگوریتم های کلاسیک به کیفیت فاز پیش پردازش بود.
جایگاه پژوهش حاضر:
با توجه به پیشینه ذکر شده، این پژوهش با تمرکز بر چالش های خاص زبان فارسی در محیط تجارت الکترونیک (وجود کلمات فینگلیش، اختصارات و نام های تجاری)، از معماری پیشرفته ParsBERT برای تنظیم دقیق (Fine-tuning) روی داده های واقعی یک مارکت پلیس استفاده می کند و آن را با روش های سریع تری مانند FastText مقایسه می نماید تا یک راه حل عملی و بهینه برای استقرار در محیط های عملیاتی (Production) ارائه دهد.
۳. روش تحقیق
نوع تحقیق:
این پژوهش از نظر هدف، یک تحقیق «کاربردی» است و از منظر روش شناسی در زمره تحقیقات «تحلیلی-تجربی» (Experimental) در حوزه علوم کامپیوتر و داده کاوی قرار می گیرد.
روش گردآوری داده ها:
داده های مورد استفاده در این تحقیق، از طریق خزش (Web Scraping) قانونی در یکی از پلتفرم های معتبر تجارت الکترونیک ایران جمع آوری شده است. این مجموعه داده شامل ۱۰۰,۰۰۰ رکورد است که هر رکورد شامل فیلدهای «عنوان کالا»، «توضیحات کوتاه» و «شناسه دسته بندی سطح ۳» می باشد. در مجموع ۵۰ کلاس (دسته بندی مختلف) در نظر گرفته شده است تا تعادلی میان پیچیدگی مسئله و قابلیت اجرای مدل برقرار شود.
معرفی مدل و چارچوب پیشنهادی:
فرآیند پیشنهادی شامل مراحل زیر است:
۱. پیش پردازش داده ها: شامل نرمال سازی متون فارسی (اصلاح نیم فاصله ها، حذف علائم نگارشی غیرضروری)، حذف کلمات توقف (Stop-words) و تبدیل کلمات فینگلیش به معادل فارسی.
۲. استخراج ویژگی و نمایش برداری: استفاده از Tokenizer اختصاصی مدل ParsBERT برای تبدیل کلمات به توکن های قابل فهم برای شبکه عصبی.
۳. معماری مدل: مدل پیشنهادی مبتنی بر تنظیم دقیق (Fine-tuning) مدل ParsBERT است. خروجی آخرین لایه پنهان مربوط به توکن [CLS] به یک لایه تمام متصل (Fully Connected Dense Layer) با تابع فعال ساز Softmax متصل می شود تا احتمال تعلق کالا به هر یک از ۵۰ کلاس را محاسبه کند. رابطه ریاضی لایه خروجی به صورت زیر است:
P(y=c∣x)=exp(Wc⋅h+bc)∑k=1Kexp(Wk⋅h+bk) P(y=c | x) = \frac{\exp(W_c \cdot h + b_c)}{\sum_{k=1}^{K} \exp(W_k \cdot h + b_k)} P(y=c∣x)=∑k=1Kexp(Wk⋅h+bk)exp(Wc⋅h+bc)
که در آن hhh بردار ویژگی استخراج شده توسط BERT، WWW وزن های لایه طبقه بندی و KKK تعداد کلاس ها است.
۴. یافته ها و تحلیل
برای ارزیابی مدل ها، داده ها به سه بخش آموزش (80%80\%80%)، اعتبارسنجی (10%10\%10%) و آزمون (10%10\%10%) تقسیم شدند. مدل ها با استفاده از معیارهای استاندارد دقت (Accuracy)، صحت (Precision)، بازیابی (Recall) و امتیاز اف-یک (F1−ScoreF1-ScoreF1−Score) ارزیابی شدند.
تحلیل علمی نتایج:
نتایج ارزیابی بر روی داده های آزمون در جدول زیر (به صورت توصیفی) خلاصه شده است:
- مدل SVM با ویژگی های TF-IDF: دقت برابر با 81.5%81.5\%81.5% و F1−ScoreF1-ScoreF1−Score برابر با 79.2%79.2\%79.2%. این مدل در تشخیص کلاس های دارای داده کمتر دچار مشکل شد (Class Imbalance).
- مدل FastText: دقت برابر با 88.3%88.3\%88.3% و F1−ScoreF1-ScoreF1−Score برابر با 87.9%87.9\%87.9%. سرعت آموزش و استنتاج در این مدل بسیار بالا بود، اما در درک وابستگی های معنایی کلمات درون عنوان کالا ضعیف عمل کرد.
- مدل ParsBERT (مدل پیشنهادی): با کسب دقت 94.2%94.2\%94.2% و F1−ScoreF1-ScoreF1−Score برابر با 93.8%93.8\%93.8%، بهترین عملکرد را از خود نشان داد. معماری مبتنی بر توجه (Attention Mechanism) در این مدل به خوبی توانست ارتباط معنایی کلماتی مانند “گوشی”، “سامسونگ” و “قاب” را در عناوین طولانی درک کند و مثلا “قاب گوشی سامسونگ” را به درستی در دسته “لوازم جانبی موبایل” قرار دهد، نه “گوشی موبایل”.
توضیح کاربرد مدل پیشنهادی:
مدل پیشنهادی به عنوان یک سرویس API در سیستم ثبت کالای فروشندگان (Seller Panel) ادغام می شود. هنگامی که فروشنده عنوان کالای خود را تایپ می کند، مدل در لحظه (Real-time) سه دسته بندی با بالاترین احتمال را به او پیشنهاد می دهد. این امر فرآیند جستجو در درخت پیچیده دسته بندی ها را حذف کرده و زمان ثبت کالا را از چند دقیقه به چند ثانیه کاهش می دهد.
۵. بحث
تفسیر نتایج:
برتری محسوس مدل ParsBERT نسبت به روش های سنتی نشان دهنده اهمیت درک بافت (Context) در زبان فارسی است. در عناوین محصولات، غالبا کلمات کلیدی در ابتدا یا انتهای متن قرار می گیرند و مدل های ترانسفورمر توانایی بالایی در وزن دهی به این کلمات کلیدی دارند.
مقایسه با مطالعات پیشین:
نتایج این پژوهش هم راستا با یافته های (Chen et al., 2019) و (Farahani et al., 2021) است که تاکید بر کارایی مدل های عمیق در متون کوتاه دارند. با این حال، در مقایسه با مطالعه (Zare & Hosseini, 2023) که صرفا به روش های سنتی تکیه داشتند، این پژوهش نشان داد که در محیط واقعی مارکت پلیس که نویز داده ها (غلط های املایی، نگارش سلیقه ای فروشندگان) بالاست، مدل های از پیش آموزش دیده (Pre-trained) به دلیل دیدن حجم وسیعی از متون فارسی در فاز پیش آموزش، پایداری (Robustness) بسیار بالاتری دارند. یکی از چالش های مشاهده شده در این پژوهش، خطای مدل در کالاهایی با عناوین بسیار مبهم یا کوتاه (مانند “پیراهن” بدون ذکر مردانه یا زنانه بودن) بود که نیازمند اطلاعات تکمیلی است.
۶. نتیجه گیری و پیشنهادها
جمع بندی یافته ها:
این مقاله به بررسی و ارائه راه حلی نوین برای یکی از گلوگاه های عملیاتی در مارکت پلیس ها یعنی ثبت و دسته بندی کالا پرداخت. با بهره گیری از مدل زبانی ParsBERT و تنظیم دقیق آن بر روی داده های بومی، به دقت 94.2%94.2\%94.2% در طبقه بندی کالاها دست یافتیم که نشان از پتانسیل بالای تکنیک های NLP در تحول دیجیتال صنایع دارد.
کاربردهای عملی:
پیاده سازی این سیستم در پلتفرم های فروشگاهی منجر به کاهش خطاهای ساختاری دیتابیس، بهبود سئو (SEO) سایت از طریق تخصیص صحیح کالاها به صفحات دسته بندی، و از همه مهم تر کاهش نرخ اصطکاک (Friction) برای فروشندگان در زمان ثبت کالا می شود که نهایتا به رشد تامین کنندگان در پلتفرم کمک می کند.
پیشنهاد برای پژوهش های آینده:
۱. استفاده از یادگیری چندوجهی (Multimodal Machine Learning) با ترکیب تصویر کالا و متن برای رفع ابهام از عناوین کوتاه.
۲. پیاده سازی تکنیک های یادگیری فعال (Active Learning) تا در صورت عدم اطمینان مدل از دسته بندی، از نظرات اپراتورهای انسانی برای بهبود مستمر مدل استفاده شود.
۳. بررسی مدل های سبک تر (تراکم سازی مدل - Model Quantization/Distillation) برای کاهش هزینه محاسباتی سرور در هنگام استنتاج (Inference) در مقیاس های میلیونی.
۷. منابع
- Chen, J., et al. (2019). “Deep learning for short text classification in e-commerce: A review.” Journal of Electronic Commerce Research, 20(3), 154-170.
- Das, S., & Kumar, P. (2020). “Product categorization in online retail using FastText and word embeddings.” International Conference on Data Mining and AI (ICDMAI), Springer.
- Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). “BERT: Pre-training of deep bidirectional transformers for language understanding.” arXiv preprint arXiv:1810.04805.
- Farahani, M., Gharachorloo, M., Farahani, M., & Manthouri, M. (2021). “ParsBERT: Transformer-based model for Persian language understanding.” Neural Processing Letters, 53(6), 3831-3847.
- Liu, Y., & Zhang, H. (2022). “Multimodal product classification in Alibaba marketplace.” Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining.
- Minaee, S., Kalchbrenner, N., Cambria, E., Nikzad, N., Cheneval, M., & Gao, J. (2021). “Deep learning–based text classification: A comprehensive review.” ACM Computing Surveys (CSUR), 54(3), 1-40.
- Zare, A., & Hosseini, M. (2023). “The impact of text preprocessing on traditional machine learning algorithms for Persian e-commerce data.” Journal of Information Systems and Telecommunication, 11(2), 112-125.
- Sun, C., Qiu, X., Xu, Y., & Huang, X. (2019). “How to fine-tune BERT for text classification?.” China National Conference on Chinese Computational Linguistics, Springer.
- Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2017/2019). “Bag of tricks for efficient text classification.” Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics. (Extended applications in 2019).
- Kowsari, K., Jafari Meimandi, K., Heidarysafa, M., Mendu, S., Barnes, L., & Brown, D. (2019). “Text classification algorithms: A survey.” Information, 10(4), 150.