استخراج زنجیره های سری زمانی در داده كاوی سری زمانی با استفاده از الگوریتم های متاهیوریستیكی abstract
كشف الگو از سري هاي زماني، يكي از حوزه هاي بسيار جالب در باب اين داده هاي زماني است كه محققين زيادي به پژوهش در اين موضوع پرداخته اند. اين الگوها به عنوان توالي هاي تكرار شونده در طول زمان در نظر گرفته مي شوند. يكي از مهم ترين رويكردهاي كشف الگو براي سري هاي زماني، مبحث موتيف هاي سري زماني است. موتيف هاي سري زماني تقريباً تكرار زيردنباله هاي قرار گرفته در يك سري زماني طولاني هستند. در مقابل مبحث موتيف سري زماني، مبحث جديد زنجيره سري زماني در سال 2019 توسط ژو و همكاران معرفي شد. زنجيره هاي سري زماني را مي توان به عنوان موتيف هايي در نظر گرفت كه به مرور زمان تكامل يافته يا در برخي از جهات حركت مي كنند. تعيين طول همسايگي در زنجيره هاي زماني چالش مهمي است كه انتخاب نادرست آن منجر به كشف الگوي نامناسب مي شود. بنابراين در اين مقاله ضمن معرفي زنجيره هاي سري زماني، به دنبال تعيين طول همسايگي مناسب از طريق فرايند بهينه سازي با الگوريتم هاي فرا ابتكاري ژنتيك و ازدحام ذرات با در نظر گرفتن كمترين خطاي RMSE بين اين زنجيره ها هستيم. ديتاست مورد استفاده در اين تحقيق، دو ديتاست شتاب محوري حركت پنگوئن و سيگنال EEG يك بيمار داراي ضايعه نخاعي است. نتايج حساسيت سنجي طول همسايگي نشان داد كه انتخاب مناسب اين پارامتر مي تواند به كشف زنجيره هاي با بيشترين شباهت ممكن منجر گردد. نتايج حاصل پياده سازي روش پيشنهادي نشان داد كه دو الگوريتم فرا ابتكاري GA و PSO به يك مقدار همگرا مي شوند و در نتيجه داراي دقت يكساني هستند ولي سرعت همگرايي الگوريتم PSO بيشتر از GA است. طول زيردنباله بهينه بدست آمده براي سيگنال EEG برابر 12 و براي ديتاست حركت پنگوئن برابر 13 بدست آمد كه نشان مي دهد كه مقدار بهينه براي ديتاست هاي مختلف، احتمالا نزديك به اين مقادير باشد. همچنين مقايسه مقدار RMSE دو ديتاست نشان مي دهد كه زنجيره هاي سري زماني بدست آمده از ديتاست حركت پنگوئن، شباهت بيشتري نسبت به سيگنال EEG دارد و اين نشان مي دهد زنجيره هاي زماني كشف شده، از نظر ميزان شباهت، وابسته به ديتاست است.