سال انتشار: ۱۳۹۰

محل انتشار: دومین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۴

نویسنده(ها):

سیدمحمد علوی – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد اهواز
افشین قنبرزاده – استادیار دانشگاه شهیدچمران اهواز
سیدعنایت اله علوی – استادیار دانشگاه شهید چمران اهواز
مهدی فنواتی – مدرس گروه مکانیک دانشگاه آزاد اسلامی واحد ماهشهر

چکیده:

یادگیری تقویتی یکی از مباحث مربوط به یادگیری ماشین بوده و به عنوان یک روش کارآمد درهوشمندسازی وایجاد یک سیستم خبره مسیریابی و کنترل سیستمهای دینامیکی می تواند مورد استفاده قرارگیرد این روش یادگیری برمبنای دادن پاداش و جریمه به عامل می باشد و درطی یادگیری عامل به گونه ای رفتار می کند تا بیشترین پاداش ممکن حاصل شود دراین مقاله جهت کنترل و رهیابی یک ربات زیردریایی که مجهز به تعداد زیادی سنسور فاصله یاب می باشد از روش یادگیری تقویتی استفاده شده است دراین روش بدون اطلاع از حالتهای ممکن و موانع موجود درمسیر ربات می توان ربات را به صورت تصادفی یا با استفاده از کنترل از راه دور حرکت داد با هربار برخورد به موانع فرایند یادگیری باعث می گردد که دیگربار برخورد با مانع درآن حالت خاص صورت نگیرد و ربات درمسیری حرکت کند که به مانع برخوردنکند.