سال انتشار: ۱۳۹۰

محل انتشار: دومین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۶

نویسنده(ها):

محمد رزم آرا – گروه کامپیوتر دانشگاه آزاد اسلامی واحد اراک
بابک اسدی –
مسعود نارویی – گروه کامپیوتر دانشگاه شیراز
منصور احمدی –

چکیده:

هرزنامه که بصورت نامه های الکترونیکی ناخواسته و زائد تعریف می شود درزندگی تجاری امروزه مشکلات زیادی از جمله اشغال پهنای باند شبکه و فضای صندوق پستی کاربران ایجاد کردها ست دراین تحقیق سعی بر آن داریمتا با ارایه رویکردی نوین توانایی شناسایی هرزنامه را از نامه های الکترونیک مشروع با استفاده از روشی جدید در استخراج ویژگیها مورد ارزیابی قراردهیم دراین تحقیق ما برای اولین بار از الگوهای تکراری درتشخیص هرزنامه ها استفاده کرده ایم الگوهای تکراری درواقع الگوهایی درمتن می باشندکه تعداد تکرار آن ها درکل جملات باید از یک حداقل تعریف شده بیشتر باشد و باعث میشود ویژگیهای کمتری و بهتری از جملات استخراج شود و سربار محاسباتی کمتری نیز به سیستم تحمیل شود به دلیل کاهش تعداد ویژگیهای استخراج شده توسط این روش سرعت تشخیص به طرز قابل توجهی افزایش خواهد یافت نتایج بدست آمده برروی پایگاه داده استاندارد نشان میدهد که روش مورد نظر از کارایی خوبی برخوردار بوده و حتی باعث بهبود درنتایج کارهای مشابه نیز میشود.