سال انتشار: ۱۳۹۱

محل انتشار: نهمین کنفرانس بین المللی مهندسی صنایع

تعداد صفحات: ۵

نویسنده(ها):

مهدی ایمانی – دانشجوی کارشناسی ارشد مهندسی برق
سیده فاطمه قریشی – دانشجوی کارشناسی ارشد مهندسی مکانیک
مسعود شریعت پناهی – دانشیار دانشگاه تهران
محسن ایمانی – دانشجوی کارشناسی ارشد مهندسی برق

چکیده:

روشهای برگرفته ازیادگیری ماشین machine learning و بهویژه روشهای مبتنی بریادگیری تقویتی که بصورت گسترده برای داده کاوی و کنترل سیستمهای دینامیکی به کارمیرود اصولا برمبنای رهیافت فضای حالت (state spaceطراحیشده و به همین دلیل غالبا ماهیتی گسسته دارند از انجا که بسیاری ازمسائل واقعی درحوزه مهندسی با محیطهای پیوسته سروکار دارند نیاز به روشهای هوشمندی که بدون نیاز به یک مدل دقیق ریاضی ازسیستم و صرفا از طریق یادگیری بتوانند رفتارسیستم را پیش بینی کرده و عملکرد آن را کنترل نمایند روز بروز بیشتر احساس میشود دراین مقاله روش جدیدی برپایه الگوریتم Fuzzy Actor-Critic برای حل مسایل کنترلی درمحیطهای پیوسته ارایه میگردد روش مزبور با استفاده ازتخمین یک تابع ارزش value function جدید رفتار سیستم را بصورت پیوسته شبیهسازی کرده و سیاست policy) بهینه برای رسیدن به هدف را با کمترین هزینه محاسباتی بدست میدهد.