سال انتشار: ۱۳۹۱

محل انتشار: همایش منطقه ای علوم کامپیوتر، مهندسی کامپیورتر و فناوری اطلاعات

تعداد صفحات: ۹

نویسنده(ها):

محمد حسین نجات – دانشجوی کارشناسی ارشد نرم‌افزار – دانشگاه آزاد اسلامی واحد زنجان
واهه آغازاریان – استادیار گروه مهندسی کامپیوتر – دانشگاه آزاد اسلامی واحد تهران مرکزی
علیرضا هدایتی – استادیار گروه مهندسی کامپیوتر – دانشگاه آزاد اسلامی واحد تهران مرکزی

چکیده:

روزانه با اضافه شدن حجم زیادی از داده‌های متنی دیجیتال نیاز به آنالیز این نوع داده‌ها یکی از مسائلی است که توجه محققان را به خود جلب کرد ده است. متن کاویفرایندی است که با بررسی متون ، به کسب دانش از داده‌های متنی می‌پردازد . یکی از کاربردهای متن کاوی طبقه‌بندی خودکار متن می‌باشد. بدین معنا که به صورت خودکار تأیید می‌شود چگونگی متنی جدید ورودی به چه کلاس تعلق دارد .در این تحقیق کارایی روش‌های ترکیبی شناخته‌شده داده کاوی از قبیل رأی‌گیری، بهینه‌سازی، جمع‌آوری خودکار و ترکیب چند کلاس بندی به صورت ترکیبی را مورد بررسی قرار می‌دهیم سپس روش‌های ترکیبی مختلف را نیز بر روی مجموعه داده استاندارد ۲۱۵۷۸ Reuters به کمک نرم‌افزار WEKA مورد آزمایش قرار می‌دهیم. برای این کار پارامترهای مختلف کارایی که نسبت نظیر دقت، مقیاس پذیری به هزینه زمانی را مورد بررسی قرار داده‌ایم.