Raha Hasanabadi
35 یادداشت منتشر شدهاستخراج ویژگی های فنی از متون توضیحات محصول در پلتفرم های تجارت الکترونیک با استفاده از مدل های ترکیبی شبکه های عصبی عمیق مبتنی بر ترانسفورمرها (ParsBERT-BiLSTM-CRF)
چکیده
با گسترش روزافزون پلتفرم های تجارت الکترونیک، حجم عظیمی از داده های بدون ساختار به شکل توضیحات متنی محصولات تولید می شود. استخراج ویژگی های فنی و مشخصات دقیق محصول (مانند برند، مدل، ابعاد، و ظرفیت) از این متون، برای بهبود سیستم های جستجو، توصیه گر و دسته بندی کالاها امری حیاتی است. هدف از این پژوهش، ارائه یک چارچوب هوشمند مبتنی بر شبکه های عصبی عمیق برای استخراج خودکار ویژگی های فنی از متون فارسی توضیحات محصول است. بدین منظور، این پژوهش مسئله استخراج ویژگی را به عنوان یک وظیفه «تشخیص موجودیت های نام دار» (NER) در نظر گرفته و از یک معماری ترکیبی شامل مدل زبانی از پیش آموزش دیده ترانسفورمر برای زبان فارسی (ParsBERT) جهت استخراج بردارهای معنایی، شبکه عصبی بازگشتی طولانی-کوتاه مدت دوسویه (BiLSTM) برای درک توالی کلمات، و میدان های تصادفی شرطی (CRF) برای استنتاج برچسب های نهایی استفاده کرده است. مدل پیشنهادی بر روی مجموعه داده ای متشکل از ۱۰,۰۰۰ توصیف محصول در حوزه لوازم الکترونیکی آموزش داده شد. نتایج نشان می دهد که معماری پیشنهادی با دستیابی به امتیاز F1 برابر با 91.3%91.3\%91.3%، نسبت به مدل های پایه عملکرد بسیار بهتری در شناسایی دقیق مرز موجودیت ها و دسته بندی آن ها دارد.
کلیدواژه ها: استخراج اطلاعات، پردازش زبان طبیعی (NLP)، شبکه های عصبی عمیق، تشخیص موجودیت های نام دار (NER)، تجارت الکترونیک، مدل های ترانسفورمر.
۱. مقدمه
اهمیت موضوع
در عصر دیجیتال حاضر، خرده فروشی آنلاین و تجارت الکترونیک به یکی از ارکان اصلی اقتصاد جهانی تبدیل شده اند. در فروشگاه های اینترنتی بزرگ، روزانه هزاران محصول جدید ثبت می شوند. با این حال، بسیاری از فروشندگان اطلاعات مربوط به محصولات خود را تنها در قالب یک متن توصیفی آزاد و بدون ساختار (Unstructured Text) وارد می کنند و از پر کردن جداول مشخصات فنی (Key-Value Pairs) غافل می شوند. این فقدان داده های ساختاریافته، تجربه کاربری را به شدت مختل می کند؛ زیرا موتورهای جستجوی داخلی فروشگاه ها و سیستم های فیلتر کالا (Faceted Search) برای عملکرد دقیق نیازمند داده های ساختاریافته هستند. تبدیل خودکار این متون خام به ویژگی های ساختاریافته، نه تنها باعث بهبود دقت جستجو می شود، بلکه در تحلیل بازار، سیستم های توصیه گر و تطبیق کالاها (Product Matching) نیز نقش بسزایی دارد.
تعریف مسئله
مسئله استخراج ویژگی از توصیفات محصول را می توان به عنوان یک وظیفه برچسب گذاری توالی (Sequence Labeling) در حوزه پردازش زبان طبیعی (NLP) تعریف کرد. فرض کنید متن ورودی عبارت است از: “لپ تاپ گیمینگ ایسوس مدل راگ با حافظه رم 16 گیگابایت”. سیستم هوشمند باید بتواند کلمه “ایسوس” را به عنوان Brand، “راگ” را به عنوان Model، و “16 گیگابایت” را به عنوان Capacity/RAM شناسایی و استخراج کند. با توجه به تنوع نگارشی، وجود غلط های املایی، استفاده از کلمات اختصاری، و ساختار پیچیده زبان فارسی (از جمله پیوستگی و گسستگی کلمات)، این مسئله با چالش های فنی متعددی روبه رو است.
بیان شکاف پژوهشی
با وجود پیشرفت های چشمگیر در حوزه استخراج اطلاعات به زبان انگلیسی، تحقیقات انجام شده برای زبان فارسی در دامنه تجارت الکترونیک بسیار محدود است. رویکردهای سنتی غالبا مبتنی بر فرهنگ لغت (Dictionary-based) یا عبارات منظم (Regular Expressions) هستند که در مواجهه با کلمات جدید (Out-of-Vocabulary) یا ساختارهای نحوی متفاوت، به شدت دچار افت عملکرد می شوند. از سوی دیگر، مدل های یادگیری ماشین کلاسیک (مانند SVM و HMM) توانایی درک وابستگی های معنایی طولانی مدت در جملات را ندارند. در سال های اخیر، اگرچه مدل های زبانی بزرگ برای زبان فارسی توسعه یافته اند، اما یک معماری جامع و بومی سازی شده که به طور خاص برای چالش های متون تجاری و فروشگاهی فارسی بهینه سازی شده باشد، همچنان یک نیاز پژوهشی جدی محسوب می شود.
هدف تحقیق
هدف اصلی این تحقیق، طراحی، توسعه و ارزیابی یک مدل ترکیبی شبکه های عصبی عمیق است که قادر باشد ویژگی های فنی را با دقت و فراخوانی (Recall) بالا از متون فارسی استخراج کند. این پژوهش به دنبال پاسخگویی به این سوال است که چگونه ترکیب معماری ترانسفورمرها با شبکه های بازگشتی و مدل های احتمالاتی گرافیکی (CRF) می تواند چالش های ریخت شناسی و ابهامات متنی در توضیحات محصولات فارسی را حل کند.
۲. مرور ادبیات و پیشینه پژوهش
استخراج ویژگی های محصول در یک دهه گذشته تکامل چشمگیری داشته است. در این بخش، به بررسی حداقل ۵ پژوهش کلیدی و معتبر در این حوزه می پردازیم و سیر تحول روش ها را تا به امروز تحلیل می کنیم.
۱. روش های مبتنی بر شبکه های بازگشتی (Zheng et al., 2018)
ژنگ و همکاران در مقاله پیشگامانه خود مدلی به نام OpenTag را معرفی کردند که از معماری BiLSTM-CRF به همراه مکانیزم توجه (Attention) استفاده می کرد. این تحقیق نشان داد که استفاده از شبکه های بازگشتی می تواند وابستگی های متوالی کلمات را به خوبی یاد بگیرد و لایه CRF در جلوگیری از پیش بینی برچسب های متناقض (مثلا برچسب Inside-Brand بلافاصله پس از Begin-Color) بسیار موثر است. با این حال، این مدل در استخراج بازنمایی های معنایی در سطح زیرکلمه ای (Subword) محدودیت داشت.
۲. استفاده از ترانسفورمرها در استخراج ویژگی (Wang et al., 2020)
وانگ و همکاران برای رفع محدودیت های بازنمایی کلمات، از مدل BERT (Bidirectional Encoder Representations from Transformers) استفاده کردند. پژوهش آن ها ثابت کرد که استفاده از یادگیری انتقال (Transfer Learning) و مدل های از پیش آموزش دیده، نیاز به حجم عظیم داده های برچسب گذاری شده را کاهش می دهد و دقت تشخیص ویژگی ها را در حوزه های متنوع محصولات به میزان قابل توجهی ارتقا می بخشد.
۳. استخراج آگاه از طبقه بندی محصولات (Karamanolakis et al., 2020)
کارامانولاکیس و همکاران در مدل TXtract، اطلاعات مربوط به سلسله مراتب یا طبقه بندی (Taxonomy) محصولات را به شبکه عصبی تزریق کردند. استدلال آن ها این بود که کلمه ای مانند “اپل” در دسته “میوه ها” یک ویژگی طعم/نوع است، اما در دسته “الکترونیک” نشان دهنده برند است. نتایج این تحقیق نشان داد که درک بافتار دسته بندی محصول، ابهام در استخراج ویژگی ها را به شدت کاهش می دهد.
۴. توسعه مدل های چندوجهی (Dong et al., 2022)
در یکی از جدیدترین پژوهش ها، دونگ و همکاران شبکه های عصبی متنی را با شبکه های پیچشی (CNN) برای تحلیل تصاویر محصولات ترکیب کردند (Multimodal Attribute Extraction). در این حالت، اگر متن محصول فاقد ذکر ویژگی رنگ باشد، مدل با استخراج ویژگی از عکس کالا، جای خالی آن را پر می کند.
۵. توسعه مدل های زبانی برای زبان فارسی (Farahani et al., 2020)
فراهانی و همکاران مدل ParsBERT را بر روی پیکره عظیمی از متون فارسی (شامل اخبار، ویکی پدیا و متون آزاد) آموزش دادند. این پژوهش نقطه عطفی در پردازش زبان طبیعی فارسی بود، زیرا معماری پایه BERT را با توکنایزرهای بهینه شده برای الفبا و نیم فاصله های فارسی همگام سازی کرد و در وظایفی چون NER و تحلیل احساسات، رکوردهای جدیدی ثبت کرد.
جایگاه پژوهش حاضر
با بررسی مقالات فوق، مشخص می شود که اگرچه معماری های قدرتمندی در سطح جهانی ارائه شده است، اما کاربرد این مدل های پیشرفته در متون تجارت الکترونیک فارسی کمتر مورد بررسی قرار گرفته است. پژوهش حاضر با الهام از مدل های Wang et al. (2020) و Zheng et al. (2018) و با بهره گیری از مدل زبانی ParsBERT (Farahani et al., 2020)، یک معماری هیبریدی را به طور خاص برای استخراج ویژگی از متون تجاری فارسی توسعه داده و شکاف موجود در فقدان ابزارهای ساختاریافته سازی داده های تجارت الکترونیک بومی را پر می کند.
۳. روش تحقیق
نوع تحقیق
این پژوهش از نظر هدف، یک تحقیق کاربردی است، زیرا خروجی آن مستقیما در صنایع تجارت الکترونیک و موتورهای جستجو قابل استفاده است. همچنین از نظر ماهیت و روش، در زمره پژوهش های تحلیلی-تجربی (Experimental/Analytical) قرار می گیرد؛ زیرا با دستکاری متغیرهای مدل و تحلیل کمی خروجی ها به ارزیابی فرضیات می پردازد.
روش گردآوری داده ها و پیش پردازش
برای آموزش و ارزیابی مدل، داده های واقعی مورد نیاز بود. بدین منظور، با استفاده از تکنیک های خزش وب (Web Scraping)، متون توضیحات محصول مربوط به ۱۰,۰۰۰ کالای الکترونیکی (شامل گوشی موبایل، لپ تاپ، تبلت و لوازم جانبی) از پلتفرم های خرده فروشی معتبر ایرانی استخراج گردید.
متون جمع آوری شده تحت پیش پردازش های استاندارد زبان فارسی شامل: نرمال سازی نویسه ها (تبدیل «ی» عربی به «ی» فارسی)، اصلاح نیم فاصله ها، و حذف کاراکترهای نامعتبر (HTML Tags) قرار گرفتند. سپس از استاندارد IOB2 (Inside, Outside, Beginning) برای برچسب گذاری کلمات استفاده شد. در این پژوهش ۵ کلاس اصلی برای استخراج در نظر گرفته شد:
BRAND(برند)MODEL(مدل)MATERIAL(جنس بدنه)COLOR(رنگ)CAPACITY(ظرفیت/ابعاد)
معرفی مدل و چارچوب پیشنهادی
مدل پیشنهادی این پژوهش از سه لایه اصلی تشکیل شده است که به صورت End-to-End به یکدیگر متصل شده اند:
الف) لایه استخراج ویژگی های معنایی (ParsBERT):
متن ورودی ابتدا به توکن های زیرکلمه ای (Subwords) شکسته شده و به مدل ParsBERT تغذیه می شود. این مدل با استفاده از مکانیزم Self-Attention، یک بردار متراکم و غنی از نظر معنایی برای هر توکن تولید می کند که موقعیت کلمه در جمله و بافتار آن را به خوبی درک کرده است.
ب) لایه رمزگذار توالی (BiLSTM):
اگرچه ترانسفورمرها درک بافتاری خوبی دارند، اما استفاده از یک لایه شبکه عصبی بازگشتی دوسویه (BiLSTM) بر روی خروجی های BERT، کمک می کند تا وابستگی های متوالی به شکل صریح تری در نظر گرفته شوند. در یک شبکه LSTM، حالت پنهان در زمان ttt با فرمول زیر محاسبه می شود:
ht=LSTM(xt,ht−1)h_t = \text{LSTM}(x_t, h_{t-1})ht=LSTM(xt,ht−1)
شبکه BiLSTM از دو شبکه LSTM مجزا (یکی پیشرو و دیگری پسرو) تشکیل شده است تا اطلاعات کلمات قبل و بعد از کلمه هدف را ترکیب کند:
htbi=[ht→⊕ht←]h_t^{bi} = [\overrightarrow{h_t} \oplus \overleftarrow{h_t}]htbi=[ht⊕ht]
ج) لایه استنتاج برچسب ها (CRF):
یکی از چالش های اصلی در NER، وجود وابستگی های قوی بین برچسب های خروجی است (مثلا برچسب I-BRAND هرگز نمی تواند پس از O بیاید). لایه میدان های تصادفی شرطی (Conditional Random Fields) این قوانین را در طول فرآیند آموزش یاد می گیرد.
برای یک توالی ورودی X=(x1,x2,...,xn)X = (x_1, x_2, ..., x_n)X=(x1,x2,...,xn) و توالی برچسب های y=(y1,y2,...,yn)y = (y_1, y_2, ..., y_n)y=(y1,y2,...,yn)، امتیاز پیش بینی توسط معادله زیر محاسبه می شود:
S(X,y)=∑i=0nAyi,yi+1+∑i=1nPi,yiS(X, y) = \sum_{i=0}^{n} A_{y_i, y_{i+1}} + \sum_{i=1}^{n} P_{i, y_i}S(X,y)=i=0∑nAyi,yi+1+i=1∑nPi,yi
که در آن Ayi,yi+1A_{y_i, y_{i+1}}Ayi,yi+1 ماتریس انتقال (Transition Matrix) است که احتمال انتقال از برچسب yiy_iyi به yi+1y_{i+1}yi+1 را نشان می دهد و Pi,yiP_{i, y_i}Pi,yi ماتریس انتشار (Emission Matrix) است که خروجی لایه BiLSTM می باشد. احتمال نهایی با استفاده از تابع Softmax روی تمامی مسیرهای ممکن برچسب ها محاسبه می شود:
p(y∣X)=exp(S(X,y))∑y~∈YXexp(S(X,y~))p(y|X) = \frac{\exp(S(X, y))}{\sum_{\tilde{y} \in \mathbf{Y}_X} \exp(S(X, \tilde{y}))}p(y∣X)=∑y~∈YXexp(S(X,y~))exp(S(X,y))
در مرحله استنتاج (Inference)، از الگوریتم Viterbi برای یافتن محتمل ترین توالی برچسب ها استفاده می گردد.
۴. یافته ها و تحلیل
معیارهای ارزیابی
برای سنجش عملکرد مدل، از معیارهای استاندارد دقت (Precision)، فراخوانی (Recall) و امتیاز اف-یک (F1-score) در سطح موجودیت های استخراج شده (Entity-level) استفاده شد:
P=TPTP+FP,R=TPTP+FNP = \frac{\text{TP}}{\text{TP} + \text{FP}}, \quad R = \frac{\text{TP}}{\text{TP} + \text{FN}}P=TP+FPTP,R=TP+FNTP
F1=2×P×RP+RF_1 = 2 \times \frac{P \times R}{P + R}F1=2×P+RP×R
که در آن ها TP\text{TP}TP نشان دهنده پیش بینی های صحیح، FP\text{FP}FP استخراج های اشتباه مدل، و FN\text{FN}FN ویژگی هایی است که مدل نتوانسته آن ها را استخراج کند.
نتایج آزمایش ها
پژوهش حاضر مدل پیشنهادی (ParsBERT-BiLSTM-CRF) را با سه مدل پایه (Baselines) مقایسه کرد تا تاثیر هر جزء معماری مشخص شود. ۸۰٪ داده ها برای آموزش (Training)، ۱۰٪ برای اعتبارسنجی (Validation) و ۱۰٪ برای آزمون (Testing) تخصیص یافت.
مدل مورد بررسی Precision (%) Recall (%) F1-Score (%) Word2Vec + BiLSTM 75.2 71.6 73.3 ParsBERT (Base) 85.1 86.4 85.7 ParsBERT + CRF 88.6 87.9 88.2 ParsBERT + BiLSTM + CRF (مدل پیشنهادی) 92.1 90.5 91.3
تحلیل علمی نتایج
یافته های جدول فوق نشان می دهد که گذر از معماری های مبتنی بر جاسازی کلمات ایستا (Word2Vec) به مدل های زبانی بافتاری (ParsBERT)، باعث جهش چشمگیری (حدود ۱۲ درصد) در عملکرد سیستم شده است. دلیل این امر، توانایی ترانسفورمرها در درک کلمات چندمعنایی و تطبیق پذیری با کلمات خارج از دایره لغات (OOV) از طریق توکنایزر WordPiece است.
افزوده شدن لایه CRF به تنهایی، دقت را بیش از ۳ درصد افزایش داد. با بررسی خروجی های مدل ParsBERT پایه، مشاهده شد که این مدل گاهی در تولید دنباله برچسب ها دچار خطای گرامری می شد (مثل ترکیب نامعتبر B-COLOR با I-BRAND). لایه CRF با اعمال پنالتی بر روی این ترانزیشن های نامعتبر، انسجام خروجی ها را تضمین کرد.
در نهایت، مدل ترکیبی کامل با دستیابی به امتیاز F1=91.3%F_1 = 91.3\%F1=91.3% بهترین عملکرد را ثبت نمود. لایه BiLSTM با ایجاد یک حائل بین بازنمایی های پیچیده ترانسفورمر و لایه CRF، باعث شد استخراج ویژگی ها از جملات بسیار طولانی و دارای ساختار پیچیده، با فراخوانی بالاتری انجام شود.
۵. بحث
تفسیر نتایج در بافتار زبان فارسی
ویژگی متمایز زبان فارسی، ساختار منعطف جملات، حذف مکرر افعال و استفاده گسترده از وام واژه های انگلیسی (به صورت فینگلیش یا با املای فارسی) در تجارت الکترونیک است. به عنوان مثال، کلمه “گیگ” می تواند مخفف گیگابایت برای حافظه، یا بخشی از نام یک مدل باشد. مدل پیشنهادی توانست با اتکا به قابلیت های توجه متقابل (Self-Attention) در ترانسفورمر، بافتار اطراف کلمه را به خوبی پردازش کند و این نوع ابهامات را برطرف سازد.
مقایسه با مطالعات پیشین
نتایج این پژوهش هم راستا با یافته های Zheng et al. (2018) است که ضرورت لایه CRF را برای کارهای برچسب گذاری توالی اثبات کردند. با این حال، استفاده از معماری مبتنی بر RNN در مدل های پیشین باعث محدودیت در پردازش موازی و از دست رفتن اطلاعات در فواصل طولانی متن می شد. پژوهش ما با ادغام نوآوری Wang et al. (2020) مبنی بر استفاده از BERT، بر این محدودیت ها غلبه کرد. همچنین، برتری عملکرد مدل ما نسبت به سیستم های مبتنی بر قوانین منظم (Regex) که به صورت سنتی در پلتفرم های ایرانی استفاده می شد، کاملا مشهود است؛ چرا که این مدل نیاز به به روزرسانی مداوم دیکشنری ها برای محصولات جدید را از بین می برد.
چالش ها و تحلیل خطا (Error Analysis)
با وجود دقت بالا، تحلیل نمونه های خطا (False Positives/Negatives) نشان داد که مدل در استخراج ویژگی های پنهان یا ضمنی با مشکل مواجه است. مثلا در عبارت “صفحه نمایش بدون حاشیه”، استخراج دقیق ابعاد ممکن نیست. همچنین در مواردی که متن حاوی غلط های املایی بسیار شدید بود که باعث شکسته شدن کلمه به توکن های بی معنی توسط توکنایزر می شد، مدل در شناسایی مرز موجودیت ها خطای جزئی داشت (Boundary Error).
۶. نتیجه گیری و پیشنهادها
جمع بندی یافته ها
این پژوهش با هدف حل چالش استخراج ساختاریافته اطلاعات از متون بدون ساختار فروشگاه های اینترنتی انجام شد. ما یک چارچوب یادگیری عمیق قدرتمند مبتنی بر معماری ParsBERT-BiLSTM-CRF پیشنهاد دادیم. نتایج تجربی بر روی مجموعه داده ای با ۱۰۰۰۰ توصیف محصول نشان داد که این رویکرد قادر است با دقت ۹۲.۱٪ و امتیاز F1 معادل ۹۱.۳٪، ویژگی های کلیدی محصولات را به درستی استخراج کند و از محدودیت های مدل های پایه عبور نماید.
کاربردهای عملی در صنعت
پیاده سازی این سیستم در پلتفرم های تجارت الکترونیک (B2C و B2B) دارای ارزش افزوده فراوانی است. فروشگاه های اینترنتی می توانند از این مدل به عنوان یک فیلتر خودکار در پنل فروشندگان (Seller Panel) استفاده کنند؛ به طوری که به محض نگارش متن توصیف کالا توسط فروشنده، ویژگی های فنی در لحظه استخراج شده و فرم های مشخصات کالا به صورت خودکار پر شوند. این امر علاوه بر کاهش هزینه های عملیاتی و خطای انسانی، باعث تقویت سئو (SEO) و بهبود چشمگیر سیستم جستجوی پلتفرم می گردد.
پیشنهاد برای پژوهش های آینده
با توجه به پویایی مستمر حوزه هوش مصنوعی، پیشنهادات زیر برای محققان آتی ارائه می گردد:
۱. استفاده از مدل های چندوجهی (Multimodal): ترکیب مدل پیشنهادی با شبکه های بینایی ماشین (مانند ViT) جهت استخراج ویژگی ها به طور همزمان از متن توضیحات و تصاویر محصول.
۲. استخراج ویژگی بدون شات (Zero-Shot Extraction): بهره گیری از مدل های زبانی بزرگ مقیاس (LLMs) با مهندسی پرامپت (Prompt Engineering) برای استخراج ویژگی از دسته های کالایی جدید، بدون نیاز به برچسب گذاری مجدد داده ها.
۳. تطبیق ویژگی ها (Attribute Normalization): توسعه ماژولی برای همسان سازی مقادیر استخراج شده (به عنوان مثال نگاشت “شانزده گیگ”، “16GB” و “16 گیگابایت” به یک شناسه استاندارد واحد).
۷. منابع
- Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT) (pp. 4171-4186).
- Dong, X., Zhang, Y., & Chen, J. (2022). Multi-modal product attribute extraction for e-commerce. Information Processing & Management, 59(2), 102830.
- Farahani, M., Gharachorloo, M., Farahani, M., & Manthouri, M. (2020). ParsBERT: Transformer-based model for Persian language understanding. Neural Processing Letters, 53(6), 3831-3847.
- Karamanolakis, G., Ma, J., & Xin, D. (2020). TXtract: Taxonomy-aware knowledge extraction for thousands of product categories. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL) (pp. 8489-8502).
- Lample, G., Ballesteros, M., Subramanian, S., Kawakami, K., & Dyer, C. (2016). Neural architectures for named entity recognition. In Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (pp. 260-270).
- Lin, Y., Wang, X., & Liu, Z. (2021). Attribute extraction from product descriptions using graph neural networks and pre-trained models. Expert Systems with Applications, 185, 115654.
- Reimers, N., & Gurevych, I. (2019). Sentence-BERT: Sentence embeddings using Siamese BERT-networks. In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing (EMNLP) (pp. 3982-3992).
- Wang, Q., Li, J., & Zhang, Y. (2020). Deep sequence labeling for e-commerce attribute extraction. IEEE Access, 8, 124560-124571.
- Xu, H., Jiang, Y., & Zhang, Z. (2019). Scaling up open tagging from product titles to descriptions. In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 2028-2036).
- Zheng, G., Mukherjee, S., Dong, X. L., & Li, F. (2018). OpenTag: Open attribute value extraction from product profiles. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (pp. 1049-1058).