سال انتشار: ۱۳۹۴

محل انتشار: اولین کنفرانس بین المللی وب پژوهی

تعداد صفحات: ۵

نویسنده(ها):

پوریا پارسه – کارشناس کامپیوتر
ناصر پیکری – کارشناسی ارشد جامع شناسی
علی هاشمی فرد – کارشناس الکترونیک
حمیدرضا طاهری – کارشناس کامپیوتر

چکیده:

در دهه اخیر در دنیای اینترنت روزانه بالغ بر میلیونها خبر، کامنت و دیگر انواع متن هر روز بر بستر اینترنت جاری می گردد. متنکاوی یکی از تکنیک هایی است که با بکار یری الگوریتم های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و محتوایمتنی وب می پردازد. در واقع متن کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشد. در این نوشتار بابکارگیری الگوریتم های درخت تصمیم، شبکه عصبی و ماشین برداری پشتیبان بر روی مجموعه ای از اخبار در چهار حوزهخبری؛ اقتصادی، بین المللی، فرهنگی و ورزشی پردازش صورت گرفت که بتهرین مدل بدست آمده با میزان ۹۷ درصد با مدل بردارپشتیبان (SVM) از داده های آزمایشی نتیجه مطلوبی حاصل گردید.