از آنجا که ترافیک یک مسئله پیچیده محسوب میشود روشهای زیادی جهت کنترل این پدیده ارائه شده است که معروف ترین آنها استفاده از چراغهای راهنمایی و رانندگی میباشد. در اکثر مواقع زمانبندی چراغها توسط شخص و به صورت سعی و خطا انجام میشود که به علت ناکار آمدی حرکت به سوی روشهای هوشمند اجتناب ناپذیر است. به این منظور در این پژوهش روش هوشمندی براساس یادگیری تقویتی ارائه شده است. در این طرح هر چهار راه به عنوان یک عامل در نظر گرفته شده که تمام چهار راه ها محیط چندعامله را تشکیل می دهند. جهت غلبه بر پیچیدگی و ایجاد هماهنگی در سیستم چندعامله سازمان هولونی بین عاملها تعریف شده است. عاملها از یادگیری تقویتی جهت زمانبندی کارای چراغهای راهنمایی و رانندگی استفاده می کنند. روش پیشنهادی وابسته به قوانین از پیش تعیین شده و خبره نیست و یادگیری براساس تاریخچه عناصر شبکه ترافیکی انجام می شود.