سال انتشار: ۱۳۹۱

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

تعداد صفحات: ۹

نویسنده(ها):

ولی الله سرلک – دانشجوی کارشناسی ارشد مهندسی کامپیوتر، هوش مصنوعی، دانشگاه بین الم
مهدی رائیجی یانه سری – دانشجوی کارشناسی ارشد مهندسی کامپیوتر، هوش مصنوعی، دانشگاه بین الم
میترا گودرزی – کارشناس مهندسی فناوری اطلاعات، دانشگاه پیام نور واحد الیگودرز

چکیده:

کشف و استخراج الگوهای مفید از شبکه گستردهه جهانی که با عنوان وب کاوی مطرح می شودف از کاربردهای عمده داده کاوی به شمار می رود. موتورهای جستجوی امروزی، چه آنها که از نوع کاوشگر وب هستند و چه آنها که از نوع دروازه وب هستند، دیگر از عهده پاسخگویی به جستجوی کاربران در این کتابخانه عظیم نامنظم برنمی آیند. در این مقاله بازیابی هر چه سریعتر و بهتر اطلاعات از شبکه گسترده جهانی مورد توجه قرار گرفته و به همین منظور یک معماری کلی برای سیستمهای داده کاوی ارائه می شود و با معرفی جایگاه وب کاوی در داده کاوی و بررسی مشکلات موجود در کشف مؤثر اطلاعات از وب راه حلهای موجود برای برخورد با هر یک از این مشکلات در قالب جداولی به نامهای SPAM(Solution_Problem Analysis Matrix) و T&A(Tolls and Approaches) ارائه می شوند. SPAM ابزاری است که چارچوب مورد نیاز برای انتخاب روش مناسب برای پیاده سازی یک سیستم وب کاوی را در اختیار قرار می دهد و T&A ابزاری است که برای انتخاب ابزارها و روشهای مناسبی بکار می رود که برای ساخت یک سیستم وب کاوی در دسترسند. این ابزارها در سیستمی به نام AUT_UniversitiesPortal که دروازه ای برای دستیابی به مجموعه طبقه بندی شده ای از سایتهای دانشگاههای مختلف دنیا است، مورد تست و ارزیابی قرار گرفته اند.