سال انتشار: ۱۳۹۰

محل انتشار: دومین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۵

نویسنده(ها):

آزاده بیرانوند – گروه کامپیوتر دانشگاه شهید چمران اهواز
علیرضا عصاره –
بیتا شادگار –

چکیده:

امروزه افزایش حجم هرزنامه ها برای بیشتر کاربران اینترنت آزاردهندها ست درسالهای اخیر به کارگیری تکنیکهای یادگیری ماشین برای فیلتر کردن خودکار هرزنامه ها توجه بسیاری از محققان را جلب کرده است دراین مقاله یک سیستم فیلترینگ هرزنامه ارایه شده است که مبتنی بر الگوریتم adaboost می باشد درروش پیشنهادی از کلمات موجوددرایمیل به عنوان ویژگیهای پایه درمساله ی طبقه بندی ایمیل استفاده شده است از آن جهت که انتخاب ویژگی نقش مهمی را دربهبود کارایی فیلتر کردن هرزنامه ایفا می کنددر سیستم فیلترینگ پیشنهادی از یک روش ترکیبی برای شناسایی ویژگیهای مرتبط وحذف ویژگیهای نامربوط استفاده شده است نتایج برروی مجموعه داده ی استاندارد lingspam مورد آزمایش و مقایسه قرارگرفته است درنهایت برای مقایسه نتایج حاصل چندالگوریتم دیگر را روی داده ها اعمال کرده و نتایج آنها با نتایج بدست آمده مقایسه می شود نتایج آزمایشات نشان میدهند این سیستم کارایی قابل قبولی درحدود ۰٫۹۸۳ را نشان میدهد.