سال انتشار: ۱۳۹۱

محل انتشار: سومین همایش ملی مهندسی صنایع و سیستم

تعداد صفحات: ۹

نویسنده(ها):

امین عشیر – گروه کامپیوتر، دانشجوی دانشگاه آزاد اسلامی واحد دزفول
مرضیه سیفی پور – گروه کامپیوتر- دانشگاه آزاد اسلامی واحد نجف آباد
امین مهران زاده – گروه کامپیوتر، عضو هیئت علمی دانشگاه آزاد اسلامی واحد دزفول
فراز فروتن – گروه کامپیوتر، عضو هیئت علمی دانشگاه آزاد اسلامی واحد دزفول

چکیده:

خوشه بندی داده ها بر اساس شباهت از جمله مراحل مهم در تحلیل داده ها و یکی از ابزارهای پرکاربرد در حوزه داده کاوی است. در حالی که مسئله خوشه بندی مسئله دوشاری در زمینه جریان داده ها بشمار می رود. این دشواری به دلیل حجم زیاد داده دریافتی از یک جریان است که باعث ناکارآمد شدن الگوریتم های سنتی CLARANS و BIRCH شده است. این داده ها اشاره به حجم وسیعی از اطلاعات انباشته شده دارد که محدودیت های فراوانی برای پردازش ایجاد کرده اند. لذا می بایست الگوریت های جدید DBSCAN و STING برای برخورد با اینگونه داده ها توسعه یابند. به دلیل توانمندی روش های خوشه بندی در تولید خوشه های با کیفیت توسعه این الگوریتم ها برای مدیریت و دسته بندی داده های جریانی یکی از اهداف این مقاله می باشد.