امید نیکنامی

امید نیکنامی

مطالب
ترتیب بر اساس: جدیدترینپربازدیدترین

فیلترهای جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۱ مورد از کل ۱ مورد.
۱.

قیمت گذاری پویای کلاس های مشتریان در سیستم های حمل ونقل ریلی با استفاده از الگوریتم شبکه عمیق Q(مقاله علمی وزارت علوم)

کلیدواژه‌ها: قیمت گذاری پویا یادگیری تقویتی عمیق حمل ونقل ریلی

حوزه‌های تخصصی:
تعداد بازدید : ۶ تعداد دانلود : ۵
هدف: در این پژوهش به بررسی مسئله قیمت گذاری پویا در سیستم های حمل ونقل ریلی با استفاده از تکنیک های پیشرفته یادگیری تقویتی عمیق پرداخته شده است. هدف اصلی این پژوهش، بهینه سازی درآمد شرکت های حمل ونقل ریلی، از طریق ایجاد سیاست فروش بلیت است که بتواند قیمت بلیت را با در نظر گرفتن کلاس های خدماتی به صورت پویا تنظیم کند. این رویکرد به شرکت های حمل ونقل ریلی این امکان را می دهد تا با تنظیم دقیق تر قیمت ها، بر اساس تقاضای مسافران، درآمد بیشتری کسب کنند و سودآوری خود را بهبود بخشند. روش: در این پژوهش، به منظور حل مسئله قیمت گذاری پویا، از الگوریتم شبکه عمیق Q، یکی از الگوریتم های پُرکاربرد یادگیری تقویتی عمیق، بهره گرفته شده است. این الگوریتم یک الگوریتم پیش گامانه است که شبکه های عصبی عمیق را با یادگیری Q ترکیب می کند. در الگوریتم شبکه عمیق Q، شبکه های عصبی عمیق وظیفه تقریب مقادیر Q را به جای جدول پُرهزینه Q برعهده دارند. یک شبکه عصبی عمیق می تواند حالت فعلی و یک عمل ممکن را مشاهده کند و به صورت مستقیم مقدار Q را تقریب بزند. توانایی الگوریتم شبکه عمیق Q در یادگیری سیاست های بهینه در محیط های پیچیده، این الگوریتم را به یک الگوریتم پُرکاربرد تبدیل کرده است. با توجه به این نکته که مدل های یادگیری تقویتی، اغلب برای تحلیل بیش از حد پیچیده به کار می روند، تحلیل استراتژی های قیمت گذاری متفاوت، فقط با آزمایش های عددی و شبیه سازی به دست می آیند. یافته ها: نتایج شبیه سازی ها نشان می دهد که الگوریتم شبکه عمیق Q، به طور موفقیت آمیزی به یک سیاست قیمت گذاری پایدار هم گرا تبدیل شده است. در این مطالعه، شاخص های عملکردی مختلفی مانند درآمد کل، ظرفیت باقی مانده، میانگین قیمت های ارائه شده به مشتریان و تعداد بلیت های فروخته شده در هر کلاس خدماتی بررسی شد. الگوریتم در مراحل اولیه با نرخ یادگیری بالا بهبود و به تدریج به پایداری و ثبات دست یافت. میانگین درآمد کل، پس از ۵۰۰۰ تکرار، به مقدار ۲۲۵ هزار هم گرا می شود. این مقدار نشان دهنده آن است که این شرکت به طور متوسط، از هر قطار ۲۲۵ هزار واحد پولی درآمد کسب می کند. میانگین ظرفیت باقی مانده نیز پس از حدود ۳۰۰۰ تکرار، به مقدار صفر نزدیک می شود. هم گرایی نمودار میانگین ظرفیت باقی مانده به صفر، نشان دهنده این است که عامل یادگیری تقویتی، به طور مؤثری یاد گرفته است که برای حداکثرسازی درآمد کل، می بایست تمامی بلیت های موجود را به فروش برساند. شاخص میانگین قیمت های پیشنهادی به مشتریان، پس از حدود ۷۵۰۰ تکرار به یک حالت پایدار می رسد، به این معنا که الگوریتم به یک سیاست قیمت گذاری بهینه دست پیدا کرده است. در این وضعیت، میانگین قیمت ها در محدوده ۶۸۰ تا ۷۰۰ واحد پولی باقی می ماند و نوسان های چشمگیری مشاهده نمی شود. به عبارت دیگر، مدل یادگیری تقویتی بر اساس شاخص میانگین قیمت های پیشنهادی هم گرا شده است. در نهایت، پس از حدود ۵۰۰۰ تکرار، میانگین تعداد بلیت فروخته شده برای تمامی کلاس های خدماتی، به یک سطح تقریباً ثابت و پایدار می رسد. میانگین تعداد بلیت فروخته شده برای کلاس اکونومی، حدود ۱۷۵ تا ۱۸۰ بلیت، کلاس بیزینس حدود ۱۳۰ تا ۱۳۵ بلیت، کلاس ویژه حدود ۶۰ تا ۶۵ بلیت و کلاس هتل حدود ۲۳ تا ۲۵ بلیت به دست آمد. نتیجه گیری: نتایج این پژوهش نشان می دهد که پس از حدود ۷۵۰۰ تکرار، الگوریتم شبکه عمیق Q به یک سیاست بهینه و پایدار رسیده است و تغییرات چشمگیری در عملکرد مشاهده نمی شود. همچنین می توان نتیجه گرفت که استفاده از الگوریتم شبکه عمیق Q در قیمت گذاری پویا، می تواند به بهبود چشمگیری در مدیریت درآمد سیستم های حمل ونقل ریلی منجر شود. این الگوریتم با قابلیت یادگیری و سازگاری با شرایط متغیر، قادر است که سیاست های قیمت گذاری مؤثری را با هدف حداکثرسازی درآمد به کار گیرد و همچنین، تعداد بهینه بلیت های فروخته شده در هر کلاس خدماتی را تعیین کند. این دستاوردها می توانند به شرکت های حمل ونقل ریلی در بهبود راهبردهای قیمت گذاری و افزایش بهره وری اقتصادی کمک شایانی کنند.

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان