[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما ::
بخش‌های اصلی
صفحه اصلی::
اطلاعات نشریه::
برای نویسندگان::
آرشیو مجله و مقالات::
برای داوران::
تماس با ما::
امکانات پایگاه::
::
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
پایگاه های نمایه کننده







 
..
آمار سایت
تعداد مشاهده ی مقالات: 2702565

مقالات منتشر شده: 653
نرخ پذیرش: 73.82
نرخ رد: 17.64

میانگین دریافت تا تصمیم‌گیری اولیه: 5 تا 10 روز
میانگین دریافت تا پذیرش: 190 روز
____
..
:: دوره 5، شماره 3 - ( 11-1394 ) ::
دوره 5 شماره 3 صفحات 246-233 برگشت به فهرست نسخه ها
یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک
محمد اصلانی* ، محمد سعدی مسگری ، حمید مطیعیان
چکیده:   (6315 مشاهده)

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت کردن افزایش تقاضای سفر و جلوگیری از ترافیک شهری، افزایش کارایی زیر ساخت های موجود از طریق سیستم های هوشمند کنترل ترافیک می باشد.

از سوی دیگر کنترل ترافیک به دلیل طبیعت توزیع یافته و خودمختار آن توسط سیستم های چند عامله به خوبی قابل مدلسازی می باشد. رانندگان و چراغ های راهنمایی را می توان به عنوان عامل هایی که رفتارهای هوشمندانه ای از خود نشان می دهند در نظر گرفت. برای ایجاد چنین رفتارهایی نیاز است که دانش لازمه از محیط اطراف در ذهن عامل قرار داده شود اما به دلیل پیچیدگی های بالای موجود در الگوهای ترافیک شهری و ناایستا بودن اغلب محیط های ترافیکی قرار دادن یک دانش اولیه از محیط در ذهن عامل ها بسیار دشوار و غیر عملی می باشد. بنابراین نیاز به یک روشی که عامل در طول تعامل با محیط بتواند دانش لازمه را بدست آورد کاملاً ضروری است که در این تحقیق برای حل این چالش از یادگیری تقویتی استفاده شد. هدف مقاله حاضر بهبود استراتژی های کنترل ترافیک و به طور خاص کنترل هوشمند چراغ های راهنمایی از طریق توسعه تکنیک های یادگیری تقویتی در سیستم های چند عامله است. معماری عملگر – نقاد به عنوان یک معماری رایج در یادگیری تقویتی که دارای ساختار حافظه جداگانه ای هم برای سیاست و هم برای تابع ارزش است مورد استفاده قرار گرفت. نتایج این تحقیق نشان دادند که کنترل هوشمند چراغ های راهنمایی منجر به کاهش 23% طول صف و 16% زمان سفر نسبت به کنترل غیر هوشمند چراغ های راهنمایی برای یک تقاطع منفرد می شود.

واژه‌های کلیدی: سیستم های چند عامله، یادگیری تقویتی، معماری عملگر - نقاد و کنترل ترافیک
متن کامل [PDF 785 kb]   (4547 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: سامانه های اطلاعات مکانی
دریافت: 1394/4/26
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

M. Aslani, M. S. Mesgari, H. Motieyan. An Actor-Critic Reinforcement Learning Approach in Multi-Agent Systems for Urban Traffic Control. JGST 2016; 5 (3) :233-246
URL: http://jgst.issgeac.ir/article-1-344-fa.html

اصلانی محمد، مسگری محمد سعدی، مطیعیان حمید. یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک. علوم و فنون نقشه برداری. 1394; 5 (3) :233-246

URL: http://jgst.issgeac.ir/article-1-344-fa.html



بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.
دوره 5، شماره 3 - ( 11-1394 ) برگشت به فهرست نسخه ها
نشریه علمی علوم و فنون نقشه برداری Journal of Geomatics Science and Technology