سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۵

نویسنده(ها):

احمد عبداله زاده – دانشگاه صنعتی امیرکبیر
قربان خردمندیان – دانشگاه صنعتی امیرکبیر

چکیده:

در این مقاله یکروش جدید خوشه بندی مفهومی صفحات وب مبتنی بر متن اتصالات بین صفحات وب و اصطلاحنامه معرفی می شود کلمات موجود در بین دو تگ < TITLE> <TITLE> برای هر صفحه وب به عنوان اطلاعات متنی و همچنین تعداد لینکهای بین صفحات به عنوان دو ویژگی برای سنجش شباهت بین صفحات در نظر گرفته شده است علاوه بر این پردازش مفهومی به منظور سنجش شباهت مفهومی بین کلمات با استفاده از یک اصطلاحنامه در حوزه مورد نظر انجام می شود با استفاده ازاین ویژگیها یک معیار شباهت تعریف شده است فرایند خوشه بندی نیز بصورت سلسله مراتبی انجام میشود. برای ارزیابی روش پیشنهادی آنرا برروی داده های مختلفی مورد آزمایش قرار دادیم که نتایج خوبی حاصل شد و همچنین الگوریتم پیشنهادی از سرعت خوبی برخوردار است.