سال انتشار: ۱۳۹۱

محل انتشار: همایش منطقه ای علوم کامپیوتر، مهندسی کامپیورتر و فناوری اطلاعات

تعداد صفحات: ۱۸

نویسنده(ها):

هومن کاشانیان – دانشجوی کارشناسی ارشد نرم‌افزار – دانشکده برق و کامپیوتر – دانشگاه آزا

چکیده:

یکی از مباحث مهم در حوزه بازیابی اطلاعات خوشه بندی مستندات براساس شباهت بین آن‌ها می‌باشد که با توجه به وجود همین شباهت‌ها و معیارهای تعیین آن‌ها می‌توان روند خوشه بندی مستندات را بهبود بخشید. از آنجایی که تاکنون بین روش‌های خوشه بندی سلسله مراتبی و جز بندی مقایسه‌ای برمبنای فاصله بین ترم‌های مستندات و شیوه‌های تعیین شباهت صورت نگرفته بر آن شدیم تا پنج روش خوشه بندی، براساس هفت معیار تعیین فاصله را با دو روش نمایش بردار ویژگی مستندات SingleWord و روش پیشنهادی Rich Document بر اساس تئوری برهان قابل استماع آن که در دهه ۸۰ میلادی مطرح گردید را آزمایش نمایی که نتایج ارائه شده حاصل از آزمایشات، حاکی از برتری برجسته‌ترین شباهت برمبنای تئوری برهان قابل استماع می‌باشد .