سال انتشار: ۱۳۹۱

محل انتشار: بیست و هفتمین کنفرانس بین المللی برق

تعداد صفحات: ۱۱

نویسنده(ها):

رضا کاکولاریمی – دانشجوی کارشناسی ارشد برق
محمدباقر نقیبی سیستانی – استادیار دانشگاه فردوسی مشهد

چکیده:

تجربه تجدید ساختاردربسیاری ازکشورهای جهان نشان میدهد که علیرغم اندیشه ی ایجاد بازاررقابتی متاسفانه بازاری با رقابت کامل محقق نشده است و برخی ازبازیگران توانایی اعمال قدرت بازار را دارا می باشند دربازارهای با رقابت ناکامل تولید کنندگان درمی یابند که اگر درقیمتی بالاتر ازهزینه ی حدیشان پیشنهاد دهند ممکن است سودبیشتری بدست اورند بنابراین استراتژی قیمت دهی به یکی ازچالش برانگیزترین مسائل برای تولید کنندگان تبدیل شده است روشهای متنوعب برای قیمت دهی درمقاله های مختلف ارایه شده است که یکی ازپرطرفدارترین این روشها درسال های اخیر الگوریتم Q-Learning(QL می باشد الگوریتم QL این توانایی را دارد که ازتجربیات خود درس بگیرد و به بهترین سیاست برای عملکرد درمحیط برسد اما این الگوریتم همواره خود را دربرابر یک چالش بزرگ می بیند. و آن چالش دوراهی بین بهره برداری exploitation بسنده کردن به تجربیات گذشته و کاوش exploration) کاوش برای تجربیات جدید می باشد