مطالب مرتبط با کلیدواژه
۱.
۲.
۳.
۴.
۵.
۶.
۷.
۸.
۹.
رگرسیون بردار پشتیبان
حوزه های تخصصی:
به سبب اهمیت فراوان انتقال رسوب در استفادة بهینه از منابع آبی و طراحی سدها، دست یابی به روشی با دقت مناسب برای تخمین میزان بار رسوبی معلق رودخانه ها بسیار ضروری است. در این پژوهش میزان بار رسوبی معلق رودخانة صوفی چای به وسیلة روش های نوین داده کاوی شامل رگرسیون فرایند گاوسی و رگرسیون بردار پشتیبان که با بهره گیری از توابع کرنل توانایی بسیاری در حل مسائل غیرخطی دارند، تخمین زده شد، سپس، با مقادیر به دست آمده از روش های تجربی منحنی سنجة رسوب و روش فصلی مقایسه شد. روش رگرسیون فرایند گاوسی با ارائة شاخص های آماری ضریب همبستگی (R) برابر 977/0، ضریب همبستگی نش- ساتکلیف (N-S) برابر 794/0، میانگین خطای مطلق (MAE) برابر 4278/77 تن در روز، و ریشة میانگین مربعات خطا (RMSE) برابر 7455/698 تن در روز دارای بیشترین دقت و کمترین خطا از میان روش های بررسی شده در این مطالعه است. نتایج به دست آمده نشان داد هر دو روش داده کاوی بررسی شدة رگرسیون فرایند گاوسی و رگرسیون بردار پشتیبان به مراتب نتایج بهتری نسبت به منحنی سنجة رسوب و روش فصلی ارائه می کنند.
پیش بینی شاخص بورس اوراق بهادار تهران با ترکیب روشهای آنالیز مولفه های اصلی، رگرسیون بردارپشتیبان و حرکت تجمعی ذرات(مقاله علمی وزارت علوم)
حوزه های تخصصی:
پیش بینی نوسان های آینده شاخص سهام می تواند اطلاعاتی در مورد روند آینده بازار سرمایه فراهم نماید. در این پژوهش، به منظور افزایش دقت پیش بینی شاخص بورس اوراق بهادار تهران، ترکیبی از روش های آماری و هوش مصنوعی به کار رفته است. مدل اصلی پیش بینی در این پژوهش، رگرسیون بردار پشتیبان بهینه شده به وسیله الگوریتم حرکت تجمعی ذرات می باشد. در برازش مدل رگرسیون بردار پشتیبان، سه پارامتر توضیحی وجود دارد که باید ترکیبی از این سه پارامتر توسط کاربر و به صورت آزمایش و خطا انتخاب شود تا دقت مدل را به بیشترین حد خود برساند. با توجه به زمان بر بودن و کارایی پایین انتخاب پارامتر توسط کاربر، برای انتخاب ترکیب بهینه پارامترهای مدل رگرسیون بردار پشتیبان، از روش بهینه سازی حرکت تجمعی ذرات استفاده شده است که الگوریتمی قوی در حوزه بهینه سازی می باشد. با توجه به حجم زیاد داده های ورودی به مدل برای کاهش زمان یادگیری و افزایش دقت پیش بینی، با استفاده از روش آنالیز مولفه های اصلی، پیش پردازش روی متغیرهای ورودی صورت گرفته و به مولفه های اصلی تبدبل شده است. نتایج بدست آمده نشان داد که پیش پردازش روی دادها، خطای پیش بینی مدل را به طور قابل ملاحظه ای کاهش داده است.
شبیه سازی تغییرات کاربری زمین شهر همدان در سال ۲۰۴۰ میلادی با استفاده از روش اتوماسیون سلولی و داده کاوی ترکیبی «رگرسیون بردار پشتیبان و سلول های خودکار فازی»(مقاله علمی وزارت علوم)
حوزه های تخصصی:
توسعه کالبدی و رشد جمعیت شهرهای ایران در چند دهه اخیر دگرگونی هایی را پذیرفتند که سبب بروز عدم تعادل و ناهماهنگی در گسترش کالبدی شهرها و تغییرات پیش بینی نشده در توسعه فضایی شهرها شده است. در این پژوهش از تلفیق دو مدل اتوماسیون سلولی برای شبیه سازی تغییر کاربری در شهر همدان در سال ۲۰۴۰ میلادی و مدل رگرسیون بردار پشتیبان برای پایه ریزی قوانین انتقال غیرخطی برای شبیه سازی اتوماسیون سلولی و از منطق فازی برای تعریف قوانین انتقال خطی و غیرخطی استفاده شده است. به منظور آزمون مدل شبیه سازی، تغییرات کاربری شهر همدان بررسی و پس از استخراج اطلاعات از پایگاه اطلاعات جغرافیایی و تصاویر ماهواره ای، وضعیت سلول ها در دوره های زمانی مختلف مورد ارزیابی قرار گرفت. نتایج حاصل از آزمون مدل نشان می دهد مدل تلفیقی مورد نظر قادر است با رفع پیچیدگی های اطلاعاتی و ابهامات ناشی از تحولات کالبدی شهر، مدلی مناسب برای تحلیل تحولات توسعه ای در گذشته و پیش بینی جهات و میزان تغییرات کاربری فراهم آورد. در شهر همدان مساحت اراضی ساخته شده در شهر تا سال ۲۰۴۰ افزایش یافته و احتمالاً مساحت این پهنه به حدود ۶۳۵۰ هکتار برسد و رفته رفته مساحت اراضی باغستان نیز کمتر شود.
پیش بینی قیمت روزانه نفت خام برنت با ترکیب روش های آنالیز مؤلفه های اصلی و رگرسیون بردار پشتیبان(مقاله علمی وزارت علوم)
حوزه های تخصصی:
پیش بینی روند قیمت نفت خام و نوسانات آن همواره یکی از چالش های پیش روی معامله گران در بازارهای نفتی بوده است. این مقاله به پیش بینی قیمت روزانه نفت خام برنت با یک مدل ترکیبی پیشنهادی می پردازد. نمونه آماری قیمت روزانه نفت خام برنت دریای شمال از ژوئیه سال 2008 تا ژوئیه سال 2016 می باشد که از میان کل قیمت های روزانه نفت در تمام بازارهای نفتی انتخاب شده است. در این پژوهش، برای پیش بینی مدلی از ترکیب روش های آماری و هوش مصنوعی (PCA-SVR) ارائه می شود. با توجه به اثبات برتری دقت پیش بینی مدل رگرسیون بردار پشتیبان (SVR)[1] نسبت به سایر روش های پیش بینی در مطالعات گذشته هدف اصلی در این پژوهش، بهبود پیش بینی رگرسیون بردار پشتیبان با استفاده از پیش پردازش اولیه داده ها به وسیله آنالیز مولفه های اصلی (PCA)[2] است. جهت انجام پژوهش پس از انجام آزمون مانایی، با استفاده از آنالیز مولفه های اصلی متغیرهای ورودی را به مولفه های اصلی که کل پراکندگی داده ها را پوشش می دهد تبدیل نموده و به عنوان ورودی برای مدل پیش بینی در نظر گرفتیم. سپس با استفاده از مدل رگرسیون بردار پشتیبان و شبیه سازی آن در نرم افزار متلب اقدام به پیش بینی قیمت روزانه نفت خام برنت نمودیم. به منظور مقایسه عملکرد مدل های SVR و PCA-SVR از آزمون مقایسات زوجی استفاده نمودیم. نتیجه پژوهش بیانگر این موضوع بود که پیش پردازش اولیه به وسیله آنالیز مولفه های اصلی بر روی داده ها باعث کاهش خطای مدل پیشنهادی گردیده است. [1]. Support Vector Regression [2]. Principal Components Analyses
ارایه روشی نوین جهت انتخاب بهینه شاخص های مرتبط با پوشش زمین به منظور شناسایی جزایر حرارتی شهری، با بکارگیری داده های سنجش از دور(مقاله علمی وزارت علوم)
منبع:
سپهر دوره ۲۹ بهار ۱۳۹۹ شماره ۱۱۳
57 - 72
حوزه های تخصصی:
در تحقیقات اخیر، دانشمندان توجه ویژه ای به مسئله گرمایش جهانی داشته اند، زیرا دمای سطح زمین در طول قرن گذشته به طور قابل توجهی افزایش یافته است. جزایر حرارتی شهری[1]به پدیده ای ناشی از آثار شهرنشینی اشاره دارد که درجه حرارت در محیط شهری از مناطق اطراف آن بالاتر می رود. بررسی این دما توسط سنسورها دارای مشکلاتی همچون هزینه و گسسته بودن نقاط اندازه گیری را دارد. بنابراین تحقیق حاضر تلاش می کند، با تکنیک سنجش از دور مدلی کمی و پیوسته را برای پوشش این مشکلات در شهر تهران ارائه دهد. لذا با استفاده از تصاویر لندست 8 [2]، و داده های سنجنده مودیس، فاکتور هایی تولید و بررسی می شوند که در تولید جزایر حرارتی شهری مؤثر هستند. به منظور تولید این فاکتورها ابتدا با انجام تصحیحات لازم برروی تصاویر مورد نیاز، تعداد چهارده شاخص انتخاب و در سه سناریو مختلف محاسباتی شامل روش رگرسیون خطی، رگرسیون بردار پشتیبان و با استفاده از الگوریتم ژنتیک بکارگرفته شد. به منظور مدل سازی رویکردهای بیان شده، مجموعاً 2400 نقطه دارای دما به عنوان داده میدانی از منطقه مورد مطالعه (شهر تهران) جمع آوری شده است. برای ارزیابی کارایی سناریو های مورد استفاده، 30% داده ها (جمعاً 720 نقطه) به صورت اتفاقی انتخاب شده و بعنوان داده های آموزشی در نظر گرفته و مابقی 70% داده ها (جمعاً 1680 نقطه) به عنوان داده های تست مورد ارزیابی قرار گرفت.براساس نتایج بدست آمده، ترکیب مدل رگرسیون بردار پشتیبان و الگوریتم ژنتیک بهترین تطابق را (میانگین خطای مربعی 9324/0، نرمال شده میانگین خطای مربعی2695/0 و ضریب همبستگی 9315/0) با داده های زمینی مورد استفاده دارند.
مدل سازی برآورد زیست توده چوبی روی زمینی جنگل های شاخه زاد بلوط زاگرس با استفاده از داده های راداری ماهواره سنتینل -1(مقاله علمی وزارت علوم)
حوزه های تخصصی:
برآورد میزان زیست توده در توده های جنگلی با روش های سنجش از دوری اهمیت بسیاری دارد. هم زمان نبودن دریافت داده های ماهواره ای و اطلاعات میدانی و کاربرد معادلات آلومتریک جهانی، برای محاسبه وزن زیست توده درختان جنگلی داخل کشور، از مهم ترین دلایل عدم قطعیت در نتایج و تحلیل های حاصل از مطالعات مشابه قبلی به شمار می روند. به حداقل رساندن این مشکلات و بررسی قابلیت و عملکرد داده ها در توسعه مدل مناسب برآورد زیست توده جنگل، در منطقه بانکول بخش کارزان شهرستان سیروان، استان ایلام، با استفاده از داده های راداری ماهواره سنتینل 1، اخذشده در تاریخ 6 تیرماه 1396، هدف این تحقیق بود. اندازه قطر میانگین تاج پوشش درختان در 53 قطعه نمونه زمینی مربعی، مربوط به فرم رویشی شاخه زاد، به ابعاد 30×30 متر که در بازه زمانی 2 تا 20 خرداد 1396، به کمک دستگاه موقعیت یاب جهانی تفاضلی و به روش تعیین موقعیت کینماتیک آنی روی زمین اجرا و برداشت شدند، وارد روند برآورد زیست توده شد. میانگین زیست توده برداشت شده میدانی 10.63 تن درهکتار بود. پس از استخراج ویژگی های راداری، آن دسته از ویژگی ها که بیشترین میزان همبستگی را با مقادیر زیست توده داشتند انتخاب و از بین آنها، با به کارگیری الگوریتم ژنتیک و با استفاده از دو مدل رگرسیون K نزدیک ترین همسایه و رگرسیون بردار پشتیبان، مناسب ترین ترکیب ویژگی ها شناسایی و سپس، مقادیر زیست توده مدل سازی شد. اعتبارسنجی مدل ها با استفاده از 26 قطعه نمونه تست، انجام گرفت. همبستگی بین ویژگی های حاصل از داده های راداری و مقادیر زیست توده نشان داد که ویژگی های VH، Mean VV، Mean VV GLCM (Correlation) و Mean VH GLCM (Dissimilarity) بیشترین حساسیت را به مقادیر زیست توده داشتند. استفاده از مدل های رگرسیون نشان داد که روش رگرسیون بردار پشتیبان، با RMSE نسبی 0.08، از روش رگرسیون K نزدیک ترین همسایه، با RMSE نسبی 0.10، دقیق تر عمل کرده است. از بین ترکیب های ویژگی مورد بررسی نیز، بهترین ترکیب در حالت استفاده از رگرسیون K نزدیک ترین همسایه، دارای RMSE به میزان تقریبی 0.99 تن درهکتار (معادل10%) و ضریب تعیین 0.23 و در حالت استفاده از رگرسیون بردار پشتیبان، دارای RMSE به میزان 0.87 تن درهکتار (معادل 8%) و ضریب تعیین 0.14 بود. مدل های نهایی حاصل از ترکیب ویژگی های بهینه استخراج شده از داده راداری در طول موج باند C و روش های رگرسیونی پارامتری و غیرپارامتری مورد بررسی در این تحقیق به تنهایی قادر به بهبود اثر اشباع شدگی در داده، برای برآورد زیست توده در جنگل های مورد مطالعه، نبودند و منجر به پیشنهاد مدل برآوردکننده ای با صحت قابل قبول نشد.
پیش بینی شاخص کل بورس اوراق بهادار تهران با استفاده از رگرسیون بردار پشتیبان بر مبنای تکنیک کاهش ابعاد(مقاله علمی وزارت علوم)
منبع:
راهبرد مدیریت مالی سال دهم پاییز ۱۴۰۱ شماره ۳۸
1 - 26
حوزه های تخصصی:
بازارهای سهام نقش مهمی در سازماندهی سیستم های اقتصادی مدرن دارند. پژوهش های گسترده ای در زمینه پیش بینی آن ها با استفاده از تکنیک های هوشمند انجام شده است. با توجه به این که دقت عملکرد این تکنیک ها به میزان قابل توجهی تحت تأثیر ویژگی های ورودی آن است، یکی از پیشرفت های به کار رفته در استفاده از مدل های هوشمند، علاوه بر کاربرد مدل های ترکیبی، استفاده از کاهش ابعاد به عنوان یک پیش مرحله برای مدل پیش بینی می باشد. در این پژوهش برای پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران همزمان از دو روش کاهش ابعاد (انتخاب و استخراج) به منظور انتخاب ویژگی های مناسب به عنوان ورودی های مدل استفاده می شود. به طوری که برای انتخاب ویژگی ها از الگوریتم mRMR-MID و برای استخراج ویژگی ها از الگوریتم PCA استفاده می شود. سپس از رگرسیون بردار پشتیبان به عنوان مدل پیش بینی استفاده می شود. با توجه به نتایج بدست آمده از تحلیل استفاده از تکنیک های کاهش ابعاد در مدل پیش بینی، در نهایت الگوریتمی برای انتخاب ویژگی های مناسب بر شاخص، تحت عنوانISF _MID پیشنهاد می شود. نتایج نشان می دهد که با روش پیشنهادی، می توان با 7 ویژگی انتخابی به دقت بالایی در پیش بینی روزانه شاخص کل بورس اوراق بهادار تهران با درصد خطا 46/3 دست یافت. لازم به ذکر است مدل های مورد بررسی در مرحله پیاده سازی با روش اعتبارسنجی متقابل k-fold مورد ارزیابی قرار گرفتند. همچنین از معیارهای MAE، MSE و RMSE برای ازریابی عملکرد مدل های مذکور استفاده می شود.
تهیه ی نقشه ی شوری دریاچه ی ارومیه با استفاده از رگرسیون بردار پشتیبان و تصاویر لندست-8(مقاله علمی وزارت علوم)
منبع:
هیدروژئومورفولوژی سال ۵ بهار ۱۳۹۷ شماره ۱۴
43 - 65
حوزه های تخصصی:
شوری آب مشخص کننده ی پراکندگی حیات جانوری و گیاهی در دریاچه ها، دریاها و اقیانوس هاست. در این مقاله با مطالعه بازتابش از سطح آب، شاخص های شوری و همچنین داده های میدانی نقشه ی شوری دریاچه ی ارومیه تهیه گردید. سپس مدل سازی شوری این دریاچه با استفاده از رگرسیون بردار پشتیبان و تصاویر لندست-8 انجام گردید. جهت انتخاب ویژگی های مناسب از میان هفده ویژگی ورودی اولیه ی مدل از دو الگوریتم ژنتیک و انتخاب ویژگی ترتیبی به کمک نرم افزار متلب استفاده شد. در نهایت میزان شوری آب دریاچه ی ارومیه با خطا و دقت نسبتاً مناسبی تخمین گردید. به طوری که مدل رگرسیون بردار پشتیبان با تمام ویژگی ها با RMSE=24.55psu و R2=41%، مدل رگرسیون بردار پشتیبان مبتنی بر الگوریتم ژنتیک با RMSE=21.97psu و R2=54% و مدل رگرسیون بردار پشتیبان مبتنی بر انتخاب ویژگی ترتیبی با مقادیر RMSE=21.93psu و R2=53% توانستند میزان شوری دریاچه ی ارومیه را تخمین بزنند.
شبیه سازی سطح آب زیرزمینی دشت سلسله استان لرستان با استفاده از الگوریتم های فراکاوشی نوین(مقاله علمی وزارت علوم)
منبع:
هیدروژئومورفولوژی سال ۸ پاییز ۱۴۰۰ شماره ۲۸
145 - 162
حوزه های تخصصی:
در سال های اخیر افت منابع آب زیرزمینی به عنوان مهم ترین چالش در مسائل مدیریت منابع آب مطرح است. اولین گام در جهت مدیریت آب زیرزمینی، ش بیه سازی سطح آب زیرزمینی و شناسایی عوامل مؤثر بر سطح آب زیرزمینی است. از این رو در این پژوهش جهت شب یه سازی سطح آب زیرزمینی دشت سلسله واقع در استان لرستان از مدل ترکیبی رگرسیون بردار پشتیبان (SVR) با موجک و الگوریتم های فرا ابت کاری گرگ خاک ستری (GWO) و خفاش (BA) در مقیاس زمان ی ماهانه طی دوره ی آماری 2020-2010 استفاده ش د. م عیارهای ضریب همبستگی (R2)، م جذور میانگین مربعات خطا (RMSE) ، میانگین مطلق خطا (MAE)، ضریب بهره وری نش-ساتکلیف (NSE)، درصد بایاس (PBIAS) برای ارزیابی و مقایسه ی عملکرد مدل ها مورد استفاده قرار گرفت. نتایج نشان داد هر سه مدل هیبریدی، در الگوهای ترکیبی نتایج بهتری نسبت به سایر الگوهای تعیین شده دارند. همچنین، با توجه به معیارهای ارزیابی مشخص شد که از بین مدل های به کاررفته در شبیه سازی سطح آب زیرزمینی، مدل رگرسیون بردار پشتیبان-موجک با ضریب تعیین (988/0-975/0R2=)، ری شه ی میانگین مربعات خطا (146/0-112/0RMSE=)، میان گین قدرمطلق خطا (m093/0-076/0MAE=) ضریب نش ساتکلیف (978/0-963/0NS=) و درصد بایاس (001/0PBIAS=) در مرحله ی صحت سنجی عملکرد بهتری نسبت به سایر مدل ها از خود نشان داده است.