سال انتشار: ۱۳۹۰

محل انتشار: چهاردهمین کنفرانس دانشجویی مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

زینب عرب اسدی – دانشگاه صنعتی امیرکبیر، دانشکدهی ریاضی و علوم کامپیوتر
نفیسه دیدکار – دانشگاه صنعتی امیرکبیر، دانشکدهی ریاضی و علوم کامپیوتر
محمدابراهیم شیری – دانشگاه صنعتی امیرکبیر، دانشکدهی ریاضی و علوم کامپیوتر

چکیده:

یادگیری تقویتی برای مسائلی به کار میرود که عامل محیط را نمیشناسد و از طریق تعامل با محیط و دانشی که از محیط بدست می-آورد، یادگیری نماید مسلما با پیچیدهتر شدن محیط سرعت یادگیری عامل کاهش مییابد. یکی از روشهای حل مشکل کاهش سرعت یادگیری عامل، استفاده از انتقال یادگیری در یادگیری تقویتی میباشد. در این مقاله روشی را ارائه میدهیم که انتقال خودکار بین وظایف را انجام میدهد که با استفاده از الگوریتمهای کاوش زیرگراف تکراری دریک گراف، وضعیت و اعمال مشابه را یافته و با استفاده از شباهتهای بدست آمده انتقال یادگیری را انجام میدهیم و نشان میدهد که الگوریتم ارائه شده باعث افزایش سرعت یادگیری میشود و عملکرد عامل را بهبود میبخشد