ارائه روش تلفیقی کاهش نویز داده کاوی برای تخمین ماده آلی خاک با طیف سنجی VNIR

Publish Year: 1401
نوع سند: مقاله ژورنالی
زبان: Persian
View: 205

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_GIRS-13-3_001

تاریخ نمایه سازی: 11 مهر 1401

Abstract:

پیشینه و هدف خاک به عنوان منبع طبیعی ناهمگن و بزرگترین مخزن کربن آلی در اکوسیستم زمینی، از فرآیندها و مکانیسم­ های پیچیده­ای تشکیل شده است. ضرورت برآورد اطلاعات دقیق خاک در مقیاس ملی و منطقه­ ای به منظور بهبود مدیریت خاک و درک خصوصیات خاک و چگونگی تاثیرگذاری آن در کشاورزی، منجر به علاقه­مند شدن محققین به این حوزه شده است. محتوای (SOM) به عنوان شاخص کیفیت خاک در حاصلخیزی آن و تولید مواد غذایی تاثیرگذار است و نیز به عنوان یک متغیر کلیدی در مباحث محیطی و کشاورزی محسوب می­ شود. جمع ­آوری تعداد زیادی داده خاک دقیق با هدف مدیریت منابع غذایی برای جمعیت آینده ضروری است. بنابراین استفاده از  روش­ های تخمین سریع و ارزان و البته افزایش دقت برآورد محتوای SOM در ارزیابی و مدیریت منابع خاک می­ تواند کمک کننده باشد. در کشاورزی دقیق، مقیاس اطلاعات خاک مورد نیاز برای مدیریت اراضی و محصول بسیار کوچکتر بوده و به طور معمول مقیاس جمع ­آوری داده ­های میدانی جواب گوی این نیاز نمی ­باشد. نمونه ­برداری و آنالیز تعداد زیاد نمونه خاک و تهیه نقشه توزیع SOM، برای مناطق وسیع و بزرگ، بسیار دشوار است. علاوه بر این، روش­ های سنتی آزمایشگاهی تجزیه و تحلیل خاک برای نمونه ­برداری زیاد نیاز به نیروی کار بیشتر بوده و علاوه براین  زمان­ بر و هزینه ­بر است و نیاز به اپراتور آزمایشگاه متخصص دارد. هدف از تحقیق حاضر، مقایسه عملکرد دو روش PLSR و روش یادگیری ماشین درخت رگرسیون ارتقا یافته (BRT) برای پیش­ بینی مواد آلی خاک با استفاده از طیف­ VNIR، است. با استفاده از ترکیب تبدیل موجک و تشخیص باندهای مستقل، نویزهای موجود در داده­ های طیف­ سنجی خاک کاهش یافته است. علاوه بر این، طیف ­ها یا باندهای مستقل و موثر در طیف­ سنجی مواد آلی خاک انتخاب گردیدند. براین اساس، در این تحقیق، روش­ های Wavelet-PCA-PLSR و Wavelet-PCA- BRT توسعه داده شده است و کارایی هر یک از آن­ها ارزیابی می ­گردد.مواد و روش ­ها ۴۲ نمونه خاک از منطقه ناهمگن کشاورزی شهری در تهران در ۳۰-۰ سانتی­متر خاک جمع ­آوری گردید. ماده آلی خاک با استفاده از روش والکی بلک و بازتاب طیفی خاک با استفاده از طیف­سنج FieldSpec۳  اندازه­ گیری شد. مشتق اول و دوم بازتاب، جذب طیفی و مشتق اول و دوم آن محاسبه گردید. به منظور کاهش نویز و هموار­سازی طیف، از روش تبدیل موجک تابع ماتریس Sym۸  استفاده شده است. همچنین، تبدیل موجک به منظور نشان دادن و بارزسازی ویژگی­ ها در طیف انجام می­ شود. از تجزیه و تحلیل مولفه­ های اصلی و آزمون هادلینگز با فاصله اطمینان ۹۵% به منظور تشخیص داده ­های پرت استفاده شد. پس از حذف داده پرت از هر مجموعه، روش PLSR  و درخت رگرسیون ارتقا یافته بر روی بازتاب، جذب و مشتق اول و دوم آن ها در ۵ سطح از تبدیل موجک اجرا شده است. سپس، با مقایسه نتایج، مدل مناسب از طریق اعتبارسنجی انتخاب شد. در هنگام استفاده از نمونه عددی، به جای درخت تصمیم­ گیری از درخت رگرسیون استفاده می­شود، اما روند آن ­ها یکسان است. در درخت رگرسیون استفاده می­ شود. بنابراین، با پاسخ دادن به سوال باینری که حداکثر اطلاعات در مورد متغییر پاسخ از طریق کدام نود بدست می­آید، گره ریشه و دو فرزند آن تعیین می­ گردد. این فرایند در هر گره فرزند تکرار می­ شود. تولید ساختمان درخت به صورت بازگشتی تکرار شده است و یک معیار توقف معمولی در نظر گرفته می­شود. معیار توقف می­ تواند نظیر رسیدن به انشعابی که قابل تقسیم نیست و اطلاعات کمتری می­ دهد و یا زمانی که اطلاعات در گره حاوی کمتر از، پنج درصد از کل داده ­ها است، باشد. همچنین، سعی در به حداقل رساندن اندازه درخت است. برای تقسیم گره، عامل جینی، عامل آنتروپی و غیره به منظور به حداقل رساندن این عوامل استفاده شده است. علاوه بر این، در هر شاخه، مجموع مربع خطاها محاسبه شده و آن­ هایی که مقادیر حداقل دارند، انتخاب می­ شود.  روش درخت رگرسیون ارتقا یافته، دو روش درخت رگرسیون و تکنیک ارتقا را به منظور بهبود توان پیش­ بینی هر کدام از آن ­ها ترکیب می ­کند. به منظور کالیبراسیون و اعتبارسنجی مدل، به طور تصادفی به ترتیب ۳۰ و ۱۲ نمونه خاک انتخاب و برای بیان صحت مدل­ها از آماره ­های R۲ و RMSE استفاده شده است. علاوه بر این، برای انتخاب بهترین فاکتور تولید مدل PLSR برای هر طیف، واریانس و باقی مانده مقادیر برآوردی و RMSE اعتبارسنجی استفاده شد. در نهایت، برای ایجاد سطح پیوسته و آگاهی از نحوه تغییر مواد آلی خاک در منطقه، نقشه مواد آلی خاک با استفاده از تصویر ماهواره­ای لندست OLI و روش با دقت بیشتر تولید شد.نتایج و بحث برآورد رضایت بخش میزان SOM، ایجاد سطوح پیوسته با دقت بیشتر براساس کاهش نویز و حفظ داده ­های مفید، همواره مورد توجه محققین بوده است. در این تحقیق نیز با استفاده از داده­ های طیف­ سنجی خاک و اندازه ­گیری آزمایشگاهی میزان مواد آلی، سعی در برآورد چنین سطح پیوست ه­ای به منظور تخمین SOM بوده است. با استفاده از تبدیل موجک و حذف داده ­های پرت براساس هادلینگز در روش PCA، داده­ های مفید برای تولید سطح پیوسته استخراج شدند. در این روش­، باندها یا طیف­ های مستقل و موثر در مدل باقی می­مانند. با استفاده از روش همبستگی در مناطق ناهمگن همانند منطقه مورد مطالعه در این تحقیق، نتایج رضایت بخشی بدست نمی ­آید. روش PCA به طور غیر نظارت شده، با در نظر گرفتن مقادیر داده، اجزای اصلی و مقادیر و بردارهای ویژه را محاسبه نموده و سعی در ماکزیمم نمودن ماتریس کوواریانس براساس تجزیه مقادیر منفرد دارد. مدل­ های تخمین مواد آلی خاک به دو روش PLSR و BRT برای طیف بازتابی، جذبی و مشتق اول و دوم آن ها، اجرا شد. بررسی نتایج بدست آمده از توسعه این دو مدل حاکی از این است که مدل BRT، با مقادیر RMSE و R۲، به ترتیب ۰.۵۸ و ۰.۹۴، در داده مشتق دوم طیف اصلی، نتایج بهتری را بدست آورده است. از طرفی، مقادیر RMSE و R۲ در مدل PLSR برای داده مشتق اول طیف اصلی، به ترتیب ۱.۲۰۳۳۸ و ۰.۹۳۸ بدست آمده است. بطور کلی مقایسه RMSE مدل BRT و مدل PLSR، دلالت بر نتایج بهتر مدل BRT در این منطقه دارد.نتیجه ­گیری نتایج این تحقیق موید این مطلب است که در مناطق ناهمگن کشاورزی - شهری، می ­توان از پتانسیل مدل­ های توسعه داده شده Wavelet-PCA-PLSR و Wavelet-PCA-BRT برای تخمین مواد آلی خاک استفاده نمود. چرا که اندازه­ گیری میدانی ویژگی­ های شیمیایی خاک نظیر مواد آلی بسیار زمان و هزینه ­بر است. علاوه بر این، امکان اندازه­ گیری این ویژگی ­ها در پوشش وسیع وجود ندارد. با استفاده از این توابع پیوسته و تصویر ماهواره­ ای، می ­توان نقشه مقادیر مواد آلی خاک را در پوشش وسیع تولید نمود تا از آن بتوان در مطالعاتی نظیر پتانسیل کشت، حاصلخیزی خاک و توسعه پایدار آن بهره ­برداری نمود

Keywords:

طیف سنجی , ماده آلی خاک , رگرسیون کمترین مربعات جزیی , درخت رگرسیون ارتقا یافته , جنوب غربی تهران

Authors

الهه اکبری

استادیار گروه سنجش از دور و GIS، دانشکده جغرافیا و علوم محیطی، دانشگاه حکیم سبزواری، سبزوار، ایران

سهام میرزایی

دانشجوی دکتری سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، ایران

آرا تومانیان

دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران

علی درویشی بلورانی

دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران

حسینعلی بهرامی

استاد، گروه خاکشناسی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Alavipanah S.K, Damavandi A.A, Mirzaie S, Rezaie A, Matinfar H.R, ...
  • Attaeian B, Shojaeefar S, Zandieh V, Hashemi S.S. ۲۰۱۸. Study ...
  • Dai F, Zhou Q, Lv Z, Wang X, Liu G. ...
  • Doetterl S, Stevens A, Van Oost K, Quine T.A, Van ...
  • Castaldi F, Palombo A, Pascucci S, Pignatti S, Santini F, ...
  • Groenigen J.W, Mutters C.S, Horwath W.R, Van Kessel C. ۲۰۰۳. ...
  • Hotelling H. ۱۹۳۳. Analysis of a complex of statistical variables ...
  • Khanamani A, Jafari R, Sangoony H, Shahbazi A. Evaluation of ...
  • Kuang B, Tekin Y, Mouazen A.M. ۲۰۱۵. Comparison between artificial ...
  • Lacoste M, Minasny B, McBratney A, Michot D, Viaud V, ...
  • Liaghat S, Ehsani R, Mansor S, Shafri H.Z, Meon S, ...
  • Lin L, Wang Y, Teng J, Wang X. ۲۰۱۶. Hyperspectral ...
  • Liu L, Ji, M, Dong Y, Zhang R, Buchroithner M. ...
  • McCarty G.W, Reeves J.B, Reeves V.B, Follett R.F, Kimble J.M. ...
  • Mirzaei S, Darvishi Boloorani A, Bahrami H.A, Alavipanah, S.K, Mousivand ...
  • Morellos A, Pantazi X.E, Moshou, D, Alexandridis T, Whetton R, ...
  • Mouazen A.M, Kuang B, De Baerdemaeker J, Ramon H. ۲۰۱۰. ...
  • Nawar S, Abdul Munnaf M, Mouazen A.M. ۲۰۲۰. Machine learning ...
  • Nocita M, Kooistra L, Bachmann M, Müller A, Powell M, ...
  • Ghazi M, Bahrami H.A, Darvishi Boloorani A, Mirzaei S. ۲۰۱۸. ...
  • Steffens M, Kohlpaintner M, Buddenbaum H. ۲۰۱۴. Fine spatial resolution ...
  • Tekin Y, Kuang B, Mouazen A.M. ۲۰۱۳. Potential of on-line ...
  • Viscarra Rossel R.A, Behrens, T. ۲۰۱۰. Using data mining to ...
  • Viscarra Rossel R.A, Hicks W.S. ۲۰۱۵. Soil organic carbon and ...
  • Viscarra Rossel R.A, Cattle S.R, Ortega A, Fouad Y. ۲۰۰۹. ...
  • Vohland M, Besold J, Hill J, Fründ H.C. ۲۰۱۱. Comparing ...
  • Wang Y, Wang F, Huang J, Wang X, Liu Z. ...
  • Yang H, Li J. ۲۰۱۳. Predictions of soil organic carbon ...
  • Yang R.M, Zhang G.L, Liu F, Lu Y.Y, Yang F, ...
  • نمایش کامل مراجع