CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روش تلفیقی کاهش نویز داده کاوی برای تخمین ماده آلی خاک با طیف سنجی VNIR

عنوان مقاله: ارائه روش تلفیقی کاهش نویز داده کاوی برای تخمین ماده آلی خاک با طیف سنجی VNIR
شناسه ملی مقاله: JR_GIRS-13-3_001
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

الهه اکبری - استادیار گروه سنجش از دور و GIS، دانشکده جغرافیا و علوم محیطی، دانشگاه حکیم سبزواری، سبزوار، ایران
سهام میرزایی - دانشجوی دکتری سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، ایران
آرا تومانیان - دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران
علی درویشی بلورانی - دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران
حسینعلی بهرامی - استاد، گروه خاکشناسی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران

خلاصه مقاله:
پیشینه و هدف خاک به عنوان منبع طبیعی ناهمگن و بزرگترین مخزن کربن آلی در اکوسیستم زمینی، از فرآیندها و مکانیسم­ های پیچیده­ای تشکیل شده است. ضرورت برآورد اطلاعات دقیق خاک در مقیاس ملی و منطقه­ ای به منظور بهبود مدیریت خاک و درک خصوصیات خاک و چگونگی تاثیرگذاری آن در کشاورزی، منجر به علاقه­مند شدن محققین به این حوزه شده است. محتوای (SOM) به عنوان شاخص کیفیت خاک در حاصلخیزی آن و تولید مواد غذایی تاثیرگذار است و نیز به عنوان یک متغیر کلیدی در مباحث محیطی و کشاورزی محسوب می­ شود. جمع ­آوری تعداد زیادی داده خاک دقیق با هدف مدیریت منابع غذایی برای جمعیت آینده ضروری است. بنابراین استفاده از  روش­ های تخمین سریع و ارزان و البته افزایش دقت برآورد محتوای SOM در ارزیابی و مدیریت منابع خاک می­ تواند کمک کننده باشد. در کشاورزی دقیق، مقیاس اطلاعات خاک مورد نیاز برای مدیریت اراضی و محصول بسیار کوچکتر بوده و به طور معمول مقیاس جمع ­آوری داده ­های میدانی جواب گوی این نیاز نمی ­باشد. نمونه ­برداری و آنالیز تعداد زیاد نمونه خاک و تهیه نقشه توزیع SOM، برای مناطق وسیع و بزرگ، بسیار دشوار است. علاوه بر این، روش­ های سنتی آزمایشگاهی تجزیه و تحلیل خاک برای نمونه ­برداری زیاد نیاز به نیروی کار بیشتر بوده و علاوه براین  زمان­ بر و هزینه ­بر است و نیاز به اپراتور آزمایشگاه متخصص دارد. هدف از تحقیق حاضر، مقایسه عملکرد دو روش PLSR و روش یادگیری ماشین درخت رگرسیون ارتقا یافته (BRT) برای پیش­ بینی مواد آلی خاک با استفاده از طیف­ VNIR، است. با استفاده از ترکیب تبدیل موجک و تشخیص باندهای مستقل، نویزهای موجود در داده­ های طیف­ سنجی خاک کاهش یافته است. علاوه بر این، طیف ­ها یا باندهای مستقل و موثر در طیف­ سنجی مواد آلی خاک انتخاب گردیدند. براین اساس، در این تحقیق، روش­ های Wavelet-PCA-PLSR و Wavelet-PCA- BRT توسعه داده شده است و کارایی هر یک از آن­ها ارزیابی می ­گردد.مواد و روش ­ها ۴۲ نمونه خاک از منطقه ناهمگن کشاورزی شهری در تهران در ۳۰-۰ سانتی­متر خاک جمع ­آوری گردید. ماده آلی خاک با استفاده از روش والکی بلک و بازتاب طیفی خاک با استفاده از طیف­سنج FieldSpec۳  اندازه­ گیری شد. مشتق اول و دوم بازتاب، جذب طیفی و مشتق اول و دوم آن محاسبه گردید. به منظور کاهش نویز و هموار­سازی طیف، از روش تبدیل موجک تابع ماتریس Sym۸  استفاده شده است. همچنین، تبدیل موجک به منظور نشان دادن و بارزسازی ویژگی­ ها در طیف انجام می­ شود. از تجزیه و تحلیل مولفه­ های اصلی و آزمون هادلینگز با فاصله اطمینان ۹۵% به منظور تشخیص داده ­های پرت استفاده شد. پس از حذف داده پرت از هر مجموعه، روش PLSR  و درخت رگرسیون ارتقا یافته بر روی بازتاب، جذب و مشتق اول و دوم آن ها در ۵ سطح از تبدیل موجک اجرا شده است. سپس، با مقایسه نتایج، مدل مناسب از طریق اعتبارسنجی انتخاب شد. در هنگام استفاده از نمونه عددی، به جای درخت تصمیم­ گیری از درخت رگرسیون استفاده می­شود، اما روند آن ­ها یکسان است. در درخت رگرسیون استفاده می­ شود. بنابراین، با پاسخ دادن به سوال باینری که حداکثر اطلاعات در مورد متغییر پاسخ از طریق کدام نود بدست می­آید، گره ریشه و دو فرزند آن تعیین می­ گردد. این فرایند در هر گره فرزند تکرار می­ شود. تولید ساختمان درخت به صورت بازگشتی تکرار شده است و یک معیار توقف معمولی در نظر گرفته می­شود. معیار توقف می­ تواند نظیر رسیدن به انشعابی که قابل تقسیم نیست و اطلاعات کمتری می­ دهد و یا زمانی که اطلاعات در گره حاوی کمتر از، پنج درصد از کل داده ­ها است، باشد. همچنین، سعی در به حداقل رساندن اندازه درخت است. برای تقسیم گره، عامل جینی، عامل آنتروپی و غیره به منظور به حداقل رساندن این عوامل استفاده شده است. علاوه بر این، در هر شاخه، مجموع مربع خطاها محاسبه شده و آن­ هایی که مقادیر حداقل دارند، انتخاب می­ شود.  روش درخت رگرسیون ارتقا یافته، دو روش درخت رگرسیون و تکنیک ارتقا را به منظور بهبود توان پیش­ بینی هر کدام از آن ­ها ترکیب می ­کند. به منظور کالیبراسیون و اعتبارسنجی مدل، به طور تصادفی به ترتیب ۳۰ و ۱۲ نمونه خاک انتخاب و برای بیان صحت مدل­ها از آماره ­های R۲ و RMSE استفاده شده است. علاوه بر این، برای انتخاب بهترین فاکتور تولید مدل PLSR برای هر طیف، واریانس و باقی مانده مقادیر برآوردی و RMSE اعتبارسنجی استفاده شد. در نهایت، برای ایجاد سطح پیوسته و آگاهی از نحوه تغییر مواد آلی خاک در منطقه، نقشه مواد آلی خاک با استفاده از تصویر ماهواره­ای لندست OLI و روش با دقت بیشتر تولید شد.نتایج و بحث برآورد رضایت بخش میزان SOM، ایجاد سطوح پیوسته با دقت بیشتر براساس کاهش نویز و حفظ داده ­های مفید، همواره مورد توجه محققین بوده است. در این تحقیق نیز با استفاده از داده­ های طیف­ سنجی خاک و اندازه ­گیری آزمایشگاهی میزان مواد آلی، سعی در برآورد چنین سطح پیوست ه­ای به منظور تخمین SOM بوده است. با استفاده از تبدیل موجک و حذف داده ­های پرت براساس هادلینگز در روش PCA، داده­ های مفید برای تولید سطح پیوسته استخراج شدند. در این روش­، باندها یا طیف­ های مستقل و موثر در مدل باقی می­مانند. با استفاده از روش همبستگی در مناطق ناهمگن همانند منطقه مورد مطالعه در این تحقیق، نتایج رضایت بخشی بدست نمی ­آید. روش PCA به طور غیر نظارت شده، با در نظر گرفتن مقادیر داده، اجزای اصلی و مقادیر و بردارهای ویژه را محاسبه نموده و سعی در ماکزیمم نمودن ماتریس کوواریانس براساس تجزیه مقادیر منفرد دارد. مدل­ های تخمین مواد آلی خاک به دو روش PLSR و BRT برای طیف بازتابی، جذبی و مشتق اول و دوم آن ها، اجرا شد. بررسی نتایج بدست آمده از توسعه این دو مدل حاکی از این است که مدل BRT، با مقادیر RMSE و R۲، به ترتیب ۰.۵۸ و ۰.۹۴، در داده مشتق دوم طیف اصلی، نتایج بهتری را بدست آورده است. از طرفی، مقادیر RMSE و R۲ در مدل PLSR برای داده مشتق اول طیف اصلی، به ترتیب ۱.۲۰۳۳۸ و ۰.۹۳۸ بدست آمده است. بطور کلی مقایسه RMSE مدل BRT و مدل PLSR، دلالت بر نتایج بهتر مدل BRT در این منطقه دارد.نتیجه ­گیری نتایج این تحقیق موید این مطلب است که در مناطق ناهمگن کشاورزی - شهری، می ­توان از پتانسیل مدل­ های توسعه داده شده Wavelet-PCA-PLSR و Wavelet-PCA-BRT برای تخمین مواد آلی خاک استفاده نمود. چرا که اندازه­ گیری میدانی ویژگی­ های شیمیایی خاک نظیر مواد آلی بسیار زمان و هزینه ­بر است. علاوه بر این، امکان اندازه­ گیری این ویژگی ­ها در پوشش وسیع وجود ندارد. با استفاده از این توابع پیوسته و تصویر ماهواره­ ای، می ­توان نقشه مقادیر مواد آلی خاک را در پوشش وسیع تولید نمود تا از آن بتوان در مطالعاتی نظیر پتانسیل کشت، حاصلخیزی خاک و توسعه پایدار آن بهره ­برداری نمود

کلمات کلیدی:
طیف سنجی, ماده آلی خاک, رگرسیون کمترین مربعات جزیی, درخت رگرسیون ارتقا یافته, جنوب غربی تهران

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1529153/