سال انتشار: ۱۳۹۱

محل انتشار: دومین همایش ملی کامپیوتر، برق و فن آوری اطلاعات

تعداد صفحات: ۵

نویسنده(ها):

محمد رزم آرا – گروه کامپیوتر دانشگاه آزاد اسلامی واحد اراک
بابک اسدی –
مسعود نارویی – گروه کامپیوتر دانشگاه شیراز
منصور احمدی – دانشگاه آزاد اسلامی واحد شیراز

چکیده:

امروزه افزایش حجم هرزنامه ها برای بیشترکاربران اینترنت آزادهنده است درسالهای اخیر به کارگیری تکنیکهای یادگیری ماشینی برای فیلتر کردن خودکاره رزنامه ها توجه بسیاری از محققان را جلب کرده است دراین مقاله یک روش فیلترینگ هرزنامه ارایه شدها ست که مبتنی برالگوریتم random Forest می باشد درروش پیشنهادی از کلمات موجود درایمیل به عنوان ویژگیهای پایه درمساله طبقه بندی ایمیل استفاده شده است از آن جهت که انتخاب ویژگی نقش مهمی را دربهبود کارایی فیلترکردن هرزنامه ایفا می کند درسیستم فیلترینگ پیشنهادی از یک روش ترکیبی برای شناسایی ویژگیهای مرتبط و حذف ویژگیهای نامربوط استفاده شده است و نتایج برروی مجموعه داده ی استاندارد enron مورد آزمایش و مقایسه قرارگرفته اند و نتایج آزمایشات نشان میدهد که این سیستم کارایی بسیارزیادی را دارا می باشد به دلیل انتخاب بهتر ویژگیهای استخراج شده نسبت به کارهای قبلی دراین روش سرعت تشخیص نیز بطرز قابل توجهی افزایش یافته است.