سال انتشار: ۱۳۸۳

محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

احمد ایمانی پور – آزمایشگاه هوش مصنوعی و رباتیک قطب علمی کنترل و پردازش هوشمند گروه مه
مجید نیلی احمدآبادی –
بابک نجار اعرابی –

چکیده:

هنگامی که در سیستمهای چند عامله از روشهای یادگیری تقویتی استفاده می شود همکاری در یادگیری موضوعیت می یابد زیرا استفاده از دانش و تجربه ی دیگران باعث میشود که یک عامل نیاز کمتری به تجربه شخصی داشته باشد و حتی در مورد موقعیت هایی که آنها را تجربه نکرده دارای دانش گردد البته بهره گیری از دانش دیگران زمانی مطمئن و منطقی است که آنها خبره تر باشند دراین مقاله براساس یک ایده حسی – ذهنی ابتدا برای درک یک عامل از خبرگی خود الگوریتمهایی ارایه می شود که در آنها عامل جداولی را برای ثبت نشانه های خبرگی ایجاد کرده ودرحین یادگیری تغییرشان میدهد سپس با فرض آنکه عامل یادگیر خبرگی خود را میداند ما دیگر عاملها چنین شناختی از خود ندارند براساس مفاهیم وروشهای شناسایی الگو راهی پیشنهادمی شود کهعامل یادگیر بتواند مبتنی بر خبرگی خود و با استفاده از جدول Q سایر عاملها تخمینی از محدوده خبرگی دیگران به دست آورد تا به شکل کارآمدی از دانش عاملهای خبره تر از خود استفاده کند.