امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیبهای مختلف اقتصادی، محیط زیستی و اجتماعی میشود. برای جلوگیری از این آسیبها، نیاز به بهبود زیر ساختهای فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس میشود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغهای راهنمایی به عنوان یکی از شاخههای سیستمهای حمل و نقل هوشمند با استفاده از سامانههای چند عامله یادگیر است. دو سناریوی متفاوت شامل کنترل یک تقاطع منفرد و کنترل یک شریان متشکل از چهار تقاطع پیادهسازی میشوند. در سناریوی اول دو روش یادگیری Q و سارسا با یکدیگر مقایسه و نتایج نشان میدهند که روش یادگیری Q بهتر از روش یادگیری سارسا عمل مینماید. اما در سناریوی دوم به دلیل وجود چندین عامل یادگیر تقویتی و تأثیر رفتار هر عامل یادگیر بر سایر عاملها، نیاز است که اعمال عاملها با یکدیگر سازگار شوند. بهکارگیری یک مکانیسم هماهنگی برای پیدا نمودن رفتار بهینه تمام عاملها یکی دیگر از اهداف تحقیق به شمار میرود. نتایج این تحقیق نشان میدهند که کنترل هوشمند چراغهای راهنمایی منجر به کاهش 81% طول صف، 78% زمان سفر، 57% مصرف سوخت و 73% آلودگی هوا نسبت به کنترل غیر هوشمند چراغهای راهنمایی میشود.
Aslani M, Saadi Mesgari M. Developing Multi-Agent Reinforcement Learning in Adaptive Traffic Signal Control. JGST 2017; 7 (1) :85-100 URL: http://jgst.issgeac.ir/article-1-525-fa.html
اصلانی محمد، مسگری محمد سعدی. توسعه سامانههای چند عامله و یادگیری تقویتی در کنترل هوشمند چراغهای راهنمایی. علوم و فنون نقشه برداری. 1396; 7 (1) :85-100