یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

اصلانی, محمد; مسگری, محمد سعدی; مطیعیان, حمید

[صفحه اصلی ]

[Archive] [ English ]

Journal of Geomatics Science and Technology

بخش‌های اصلی

صفحه اصلی

اطلاعات نشریه

برای نویسندگان

آرشیو مجله و مقالات

برای داوران

تماس با ما

امکانات پایگاه

جستجو در پایگاه

دریافت اطلاعات پایگاه

پایگاه های نمایه کننده

آمار سایت

تعداد مشاهده ی مقالات: 2702565

مقالات منتشر شده: 653

نرخ پذیرش: 73.82

نرخ رد: 17.64

میانگین دریافت تا تصمیم‌گیری اولیه: 5 تا 10 روز
میانگین دریافت تا پذیرش: 190 روز

____

دوره 5، شماره 3 - ( 11-1394 )

دوره 5 شماره 3 صفحات 246-233

برگشت به فهرست نسخه ها

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

محمد اصلانی^*

، محمد سعدی مسگری

، حمید مطیعیان

چکیده: (6315 مشاهده)

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت کردن افزایش تقاضای سفر و جلوگیری از ترافیک شهری، افزایش کارایی زیر ساخت های موجود از طریق سیستم های هوشمند کنترل ترافیک می باشد.

از سوی دیگر کنترل ترافیک به دلیل طبیعت توزیع یافته و خودمختار آن توسط سیستم های چند عامله به خوبی قابل مدلسازی می باشد. رانندگان و چراغ های راهنمایی را می توان به عنوان عامل هایی که رفتارهای هوشمندانه ای از خود نشان می دهند در نظر گرفت. برای ایجاد چنین رفتارهایی نیاز است که دانش لازمه از محیط اطراف در ذهن عامل قرار داده شود اما به دلیل پیچیدگی های بالای موجود در الگوهای ترافیک شهری و ناایستا بودن اغلب محیط های ترافیکی قرار دادن یک دانش اولیه از محیط در ذهن عامل ها بسیار دشوار و غیر عملی می باشد. بنابراین نیاز به یک روشی که عامل در طول تعامل با محیط بتواند دانش لازمه را بدست آورد کاملاً ضروری است که در این تحقیق برای حل این چالش از یادگیری تقویتی استفاده شد. هدف مقاله حاضر بهبود استراتژی های کنترل ترافیک و به طور خاص کنترل هوشمند چراغ های راهنمایی از طریق توسعه تکنیک های یادگیری تقویتی در سیستم های چند عامله است. معماری عملگر – نقاد به عنوان یک معماری رایج در یادگیری تقویتی که دارای ساختار حافظه جداگانه ای هم برای سیاست و هم برای تابع ارزش است مورد استفاده قرار گرفت. نتایج این تحقیق نشان دادند که کنترل هوشمند چراغ های راهنمایی منجر به کاهش 23% طول صف و 16% زمان سفر نسبت به کنترل غیر هوشمند چراغ های راهنمایی برای یک تقاطع منفرد می شود.

واژه‌های کلیدی: سیستم های چند عامله، یادگیری تقویتی، معماری عملگر - نقاد و کنترل ترافیک

متن کامل [PDF 785 kb] (4547 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: سامانه های اطلاعات مکانی
دریافت: 1394/4/26

ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله

Mendeley

Zotero

RefWorks

M. Aslani, M. S. Mesgari, H. Motieyan. An Actor-Critic Reinforcement Learning Approach in Multi-Agent Systems for Urban Traffic Control. JGST 2016; 5 (3) :233-246
URL: http://jgst.issgeac.ir/article-1-344-fa.html

اصلانی محمد، مسگری محمد سعدی، مطیعیان حمید. یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک. علوم و فنون نقشه برداری. 1394; 5 (3) :233-246

URL: http://jgst.issgeac.ir/article-1-344-fa.html

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

دوره 5، شماره 3 - ( 11-1394 )

برگشت به فهرست نسخه ها