سال انتشار: ۱۳۹۰

محل انتشار: اولین کنفرانس ملی دانش پژوهان کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۸

نویسنده(ها):

مهدی حسین زاده – دانشگاه آزاد اسلامی واحد مشهد- گروه مهندسی کامپیوتر
حین احمدی ترشیزی – دانشگاه آزاد اسلامی واحد مشهد- گروه مهندسی کامپیوتر
مهرداد جلالی – دانشگاه آزاد اسلامی واحد مشهد- گروه مهندسی کامپیوتر

چکیده:

امروزه خوشه بندی نقشی حیاتی در روشهای بازیابی اطلاعات برای سازمان بندی مجموعه بزرگ مستندات متنی مانند وب دارد . در این مقاله یک روش مبتنی بر خوشه بندی نتایج جستجو در فضای اینترنت پیشنهاد شده است. یک سامانه کلاسترینگ نتایج جستجو چند متن ورودی را که حاصل نتیجه جستجو روی اسناد وب در مورد یک پرسمان خاص است به عنوان ورودی می گیرد و آنها را طوری که برای کاربر نتایج مشابه در دسته های مشابه قرار گیرند مشان می دهد. در این مقاله روی کی از فاکتورهای کلییدی تمام روشهای کلاسترینگ کار کرده و سعی کرده از ایده آن در پیدا کردن کلاسترها اساتفاده کند . تمام روشهای کلاسترینگ سعی می کنند مقدار مشابهت اعضای درون کلاسترها را افزایش داده و مشابهت بین کلاسسترها را کاهش دهند . بر همین اساس روش پیشنهادی سعی کرده ایده آن را در کلاسترینگ خود اعمال کرده و با تاثیر میزان هر کدام از مقادیر فوق به مقدار نهایی بهینه تری برسد. واضح است که میزان مشابهت درون کلاسترها با هم یک فاکتور مثبت و مشابهت بین کلتسترها با همدیگر یک فاکتور منفی در کلاسترینگ می باشد، روش پیشنهادی روی مجموعه داده مرجع NEWSGROUP که قابل مقایسه با روشهای دیگر است ارزیابی گردیده ، نتایج نشان می دهد که این روش در پیدا کردن مقادیر فوق از روشهای کلاستر قبای بهتر عمل می کند.