سال انتشار: ۱۳۹۱

محل انتشار: دومین کنفرانس ملی مهندسی نرم افزار

تعداد صفحات: ۷

نویسنده(ها):

الهام معصومی نوگورابی – مهندسی نرم افزار، دانشجوی کارشناسی ارشد دانشگاه آزاد قزوین، ایران
هدیه ساجدی – استادیاردانشگاه تهران، ایران

چکیده:

ایده تقسیم مجموعه دادههای بسیار بزرگ به زیرمجموعههای کوچکتر، که هریک جهت آموزش یک ردهبندکننده مورد استفاده قرار میگیرند و سپس تشکیل کمیتهای از این یادگیرندهها برای یاد گیریهر مسئله بر توزیع شده بودن کار تاکید دارد. پر چالشترین مسئلهدر ساخت یک سیستم ردهبندی مبتنی بر اجماع ۱، چگونگی ساخت یک مجمع مناسب از ردهبند های پایه است. در این مقاله یک روشجدید ساخت مجمع به نام ردهبند ترکیبی بر اساس خوشهبندی رده- بندهاCSBC)ارائه شده استCSBC تنوع لازم در میان مجمع رابا استفاده از تکنیک خوشهبندی ردهبندها تضمین میکند. این روشاز الگوریتم کیسه ۳ به عنوان مولد ردهبندهای پایه استفاده میکند نوع همه ردهبندهای پایه یا درخت تصمیم یا شبکه عصبی چند لایه در نظر گرفته میشود و در حین ساخت مجمع عوض نمیشود. بعد ازساخت یک تعداد زیادی از ردهبندهای پایهCSBC آنها را به کمک یک الگوریتم خوشهبندی افراز میکند. سپس با انتخاب یک ردهبند از هر افراز، مجمع نهایی را تولید میکند. روش رایگیری وزندار بهعنوان تابع جمعکننده مجمع در نظر گرفته میشود. در این مقاله اثر تعداد خوشهها بر کاراییCSBC بررسی شده و بیان میشود که یک تقریب خوب چیست. همچنین چگونگی انتخاب یک ردهبند از هرافراز نیز بررسی شده است. اثر نرخ نمونهبرداری نیز بر کارایی رده بندی ترکیبی براساس خوشه بندی رده بندها بررسی خواهد شد. در آخر آزمایشاتی بر روی تعداد وسیعی از مجموعه دادههای استاندارد در پایگاه دادگان یادگیری ماشین انجام شده است. مقایسه نتایج درمقایسه باسایرروش ها نشان ازکارایی بالای روش پیشنهادی دارد