سال انتشار: ۱۳۹۴

محل انتشار: اولین همایش ملی کامپیوتر، فناوری اطلاعات و ارتباطات اسلامی ایران

تعداد صفحات: ۱۰

نویسنده(ها):

سلمان طائی – گروه کامپیوتر، واحد مرودشت، دانشگاه آزاد اسلامی، مرودشت، ایران
علی مهجور – گروه کامپیوتر، عضو هیئت علمی دانشگاه مالک اشتر، تهران، ایران

چکیده:

الگوریتمهای خوشه بندی تلاش میکنند دادهها به خوشههایی تقسیم شوند که حداکثر شباهت بین داده های هردسته حداکثر گردد وقتی صحبت ازداده میشود روشهای مختلفی برای دسته بندی به میان می اید لیکن درخصوص داده های مبتنی برجریان مانند صداتصویر و غیره عملیات خوشه بندی کاردشواری است به علت برخط بودن جریان داده امکان ذخیره سازی تمام اطلاعات ورودی و انجام محاسبات خوشهب ندی نسبت به پردازش بهموقع داده ها غیرممنک است بنابراین محاسبه خوشه ها توسط روشهای جمعیت محور میتواند عملیاتی باهزینه اضافی برای پردازش و ذخیره سازی جریان داده باشد درصورتی که روشهای میانه گیری بدون نیاز به ذخیره سازی داده ها میتواند با ثبت اطلاعات تکمیلی درخصوص جریان داده استفاده شود بنابراین امکان کاهش نسبت ذخیره سازی به کل جریان داده ورودی افزایش می یابد باتوجه به میزان امکانات پردازشی یا ذخیره سازی میتوان الگوریتم های مختلفی را ازروشهای میانه گیری مبتنی برجریان انتخاب کرد به هرحال هرروشی که اتخاذشود باید ماهیت برخط بودن جریان داده را پوشش دهد ازسوی دیگر جریان داده دارای عناصرپرت است که ممکن است درخوشه بندی نیازمند محاسبات بیشتری باشند این امر سبب دقت بیشتر و متعاقبا تاخیر درپاسخ الگوریتم ها میشود