سال انتشار: ۱۳۹۰

محل انتشار: سومین کنفرانس مهندسی برق و الکترونیک ایران

تعداد صفحات: ۴

نویسنده(ها):

امیدرضا نظیفی – واحد تحقیقات شرکت داده کاوان ایسانا مشهد
نویدرضا نظیفی –

چکیده:

تاکنون الگوریتم ها و روشهای متعددی در جهت رتبه بندی صفحات وب ارائه شده است برخی از این روشها براساس تحلیل لینک و برخی دیگر براساس تحلیل محتوی کار می کنند هدف این مقاله ارائه روشی به منظور افزایش کیفیت رتبه بندی صفحات است که مبتنی بر ترکیب روشهای تحلیل لینک و محتوی می باشد با توجه به این متد ابتدا صفحات وب براساس خصوصیات آنها به دسته های گوناگون تقسیم می شوند و درصد نزدیکی یک صفحه با تمامی دسته ها بررسی می شود سپس محبوبیت آن صفحه را در بین کل صفحات گراف وب که با آن تشابه معنایی دارند بدست می آوریم برای این کار تغییراتی را در ساختار الگوریتم PageRank استاندارد اعمال کردیم تا تاثیر لینکهای وارد شونده به صفحه فقط از صفحات متشابه به آن در نظر گرفته شود در نهایت با ادغام درصد شباهت صفحه در دست ههایی که به آن تعلق دارد و رتبه محبوبیت آن در بین کل صفحات متشابه رتبه صفحه مذکور در هر دسته بصورت مجزا بدست می آید.