ارائه روش تلفیقی کاهش نویز داده کاوی برای تخمین ماده آلی خاک با طیف سنجی VNIR
Publish Year: 1401
نوع سند: مقاله ژورنالی
زبان: Persian
View: 223
This Paper With 5 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_GIRS-13-3_001
تاریخ نمایه سازی: 11 مهر 1401
Abstract:
پیشینه و هدف خاک به عنوان منبع طبیعی ناهمگن و بزرگترین مخزن کربن آلی در اکوسیستم زمینی، از فرآیندها و مکانیسم های پیچیدهای تشکیل شده است. ضرورت برآورد اطلاعات دقیق خاک در مقیاس ملی و منطقه ای به منظور بهبود مدیریت خاک و درک خصوصیات خاک و چگونگی تاثیرگذاری آن در کشاورزی، منجر به علاقهمند شدن محققین به این حوزه شده است. محتوای (SOM) به عنوان شاخص کیفیت خاک در حاصلخیزی آن و تولید مواد غذایی تاثیرگذار است و نیز به عنوان یک متغیر کلیدی در مباحث محیطی و کشاورزی محسوب می شود. جمع آوری تعداد زیادی داده خاک دقیق با هدف مدیریت منابع غذایی برای جمعیت آینده ضروری است. بنابراین استفاده از روش های تخمین سریع و ارزان و البته افزایش دقت برآورد محتوای SOM در ارزیابی و مدیریت منابع خاک می تواند کمک کننده باشد. در کشاورزی دقیق، مقیاس اطلاعات خاک مورد نیاز برای مدیریت اراضی و محصول بسیار کوچکتر بوده و به طور معمول مقیاس جمع آوری داده های میدانی جواب گوی این نیاز نمی باشد. نمونه برداری و آنالیز تعداد زیاد نمونه خاک و تهیه نقشه توزیع SOM، برای مناطق وسیع و بزرگ، بسیار دشوار است. علاوه بر این، روش های سنتی آزمایشگاهی تجزیه و تحلیل خاک برای نمونه برداری زیاد نیاز به نیروی کار بیشتر بوده و علاوه براین زمان بر و هزینه بر است و نیاز به اپراتور آزمایشگاه متخصص دارد. هدف از تحقیق حاضر، مقایسه عملکرد دو روش PLSR و روش یادگیری ماشین درخت رگرسیون ارتقا یافته (BRT) برای پیش بینی مواد آلی خاک با استفاده از طیف VNIR، است. با استفاده از ترکیب تبدیل موجک و تشخیص باندهای مستقل، نویزهای موجود در داده های طیف سنجی خاک کاهش یافته است. علاوه بر این، طیف ها یا باندهای مستقل و موثر در طیف سنجی مواد آلی خاک انتخاب گردیدند. براین اساس، در این تحقیق، روش های Wavelet-PCA-PLSR و Wavelet-PCA- BRT توسعه داده شده است و کارایی هر یک از آنها ارزیابی می گردد.مواد و روش ها ۴۲ نمونه خاک از منطقه ناهمگن کشاورزی شهری در تهران در ۳۰-۰ سانتیمتر خاک جمع آوری گردید. ماده آلی خاک با استفاده از روش والکی بلک و بازتاب طیفی خاک با استفاده از طیفسنج FieldSpec۳ اندازه گیری شد. مشتق اول و دوم بازتاب، جذب طیفی و مشتق اول و دوم آن محاسبه گردید. به منظور کاهش نویز و هموارسازی طیف، از روش تبدیل موجک تابع ماتریس Sym۸ استفاده شده است. همچنین، تبدیل موجک به منظور نشان دادن و بارزسازی ویژگی ها در طیف انجام می شود. از تجزیه و تحلیل مولفه های اصلی و آزمون هادلینگز با فاصله اطمینان ۹۵% به منظور تشخیص داده های پرت استفاده شد. پس از حذف داده پرت از هر مجموعه، روش PLSR و درخت رگرسیون ارتقا یافته بر روی بازتاب، جذب و مشتق اول و دوم آن ها در ۵ سطح از تبدیل موجک اجرا شده است. سپس، با مقایسه نتایج، مدل مناسب از طریق اعتبارسنجی انتخاب شد. در هنگام استفاده از نمونه عددی، به جای درخت تصمیم گیری از درخت رگرسیون استفاده میشود، اما روند آن ها یکسان است. در درخت رگرسیون استفاده می شود. بنابراین، با پاسخ دادن به سوال باینری که حداکثر اطلاعات در مورد متغییر پاسخ از طریق کدام نود بدست میآید، گره ریشه و دو فرزند آن تعیین می گردد. این فرایند در هر گره فرزند تکرار می شود. تولید ساختمان درخت به صورت بازگشتی تکرار شده است و یک معیار توقف معمولی در نظر گرفته میشود. معیار توقف می تواند نظیر رسیدن به انشعابی که قابل تقسیم نیست و اطلاعات کمتری می دهد و یا زمانی که اطلاعات در گره حاوی کمتر از، پنج درصد از کل داده ها است، باشد. همچنین، سعی در به حداقل رساندن اندازه درخت است. برای تقسیم گره، عامل جینی، عامل آنتروپی و غیره به منظور به حداقل رساندن این عوامل استفاده شده است. علاوه بر این، در هر شاخه، مجموع مربع خطاها محاسبه شده و آن هایی که مقادیر حداقل دارند، انتخاب می شود. روش درخت رگرسیون ارتقا یافته، دو روش درخت رگرسیون و تکنیک ارتقا را به منظور بهبود توان پیش بینی هر کدام از آن ها ترکیب می کند. به منظور کالیبراسیون و اعتبارسنجی مدل، به طور تصادفی به ترتیب ۳۰ و ۱۲ نمونه خاک انتخاب و برای بیان صحت مدلها از آماره های R۲ و RMSE استفاده شده است. علاوه بر این، برای انتخاب بهترین فاکتور تولید مدل PLSR برای هر طیف، واریانس و باقی مانده مقادیر برآوردی و RMSE اعتبارسنجی استفاده شد. در نهایت، برای ایجاد سطح پیوسته و آگاهی از نحوه تغییر مواد آلی خاک در منطقه، نقشه مواد آلی خاک با استفاده از تصویر ماهوارهای لندست OLI و روش با دقت بیشتر تولید شد.نتایج و بحث برآورد رضایت بخش میزان SOM، ایجاد سطوح پیوسته با دقت بیشتر براساس کاهش نویز و حفظ داده های مفید، همواره مورد توجه محققین بوده است. در این تحقیق نیز با استفاده از داده های طیف سنجی خاک و اندازه گیری آزمایشگاهی میزان مواد آلی، سعی در برآورد چنین سطح پیوست های به منظور تخمین SOM بوده است. با استفاده از تبدیل موجک و حذف داده های پرت براساس هادلینگز در روش PCA، داده های مفید برای تولید سطح پیوسته استخراج شدند. در این روش، باندها یا طیف های مستقل و موثر در مدل باقی میمانند. با استفاده از روش همبستگی در مناطق ناهمگن همانند منطقه مورد مطالعه در این تحقیق، نتایج رضایت بخشی بدست نمی آید. روش PCA به طور غیر نظارت شده، با در نظر گرفتن مقادیر داده، اجزای اصلی و مقادیر و بردارهای ویژه را محاسبه نموده و سعی در ماکزیمم نمودن ماتریس کوواریانس براساس تجزیه مقادیر منفرد دارد. مدل های تخمین مواد آلی خاک به دو روش PLSR و BRT برای طیف بازتابی، جذبی و مشتق اول و دوم آن ها، اجرا شد. بررسی نتایج بدست آمده از توسعه این دو مدل حاکی از این است که مدل BRT، با مقادیر RMSE و R۲، به ترتیب ۰.۵۸ و ۰.۹۴، در داده مشتق دوم طیف اصلی، نتایج بهتری را بدست آورده است. از طرفی، مقادیر RMSE و R۲ در مدل PLSR برای داده مشتق اول طیف اصلی، به ترتیب ۱.۲۰۳۳۸ و ۰.۹۳۸ بدست آمده است. بطور کلی مقایسه RMSE مدل BRT و مدل PLSR، دلالت بر نتایج بهتر مدل BRT در این منطقه دارد.نتیجه گیری نتایج این تحقیق موید این مطلب است که در مناطق ناهمگن کشاورزی - شهری، می توان از پتانسیل مدل های توسعه داده شده Wavelet-PCA-PLSR و Wavelet-PCA-BRT برای تخمین مواد آلی خاک استفاده نمود. چرا که اندازه گیری میدانی ویژگی های شیمیایی خاک نظیر مواد آلی بسیار زمان و هزینه بر است. علاوه بر این، امکان اندازه گیری این ویژگی ها در پوشش وسیع وجود ندارد. با استفاده از این توابع پیوسته و تصویر ماهواره ای، می توان نقشه مقادیر مواد آلی خاک را در پوشش وسیع تولید نمود تا از آن بتوان در مطالعاتی نظیر پتانسیل کشت، حاصلخیزی خاک و توسعه پایدار آن بهره برداری نمود
Keywords:
Authors
الهه اکبری
استادیار گروه سنجش از دور و GIS، دانشکده جغرافیا و علوم محیطی، دانشگاه حکیم سبزواری، سبزوار، ایران
سهام میرزایی
دانشجوی دکتری سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، ایران
آرا تومانیان
دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران
علی درویشی بلورانی
دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران
حسینعلی بهرامی
استاد، گروه خاکشناسی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :