سال انتشار: ۱۳۹۰

محل انتشار: چهاردهمین کنفرانس دانشجویی مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

علی قنبری سرخی – دانشگاه صنعتی شاهرود
فاطمه ابراهیمی – دانشگاه قم فناوری اطلاعات

چکیده:

طبقه بندی متون فازی به دلیل دارا بودن ویژگیهای زیاد و کم اهمیت فرایندی بسیار پیچیده می باشد از انجا که مطالعات کمی روی این موضوع انجام شده است هدف از مقاله حاضر استخراج بهترین ویژگیهای متن فارسی با استفاده ازروش تجزیه و تحلیل مولفه های اصلی PCA با کمک معیارهیا میانگین دقت و یادآوری خواهد بود با اختیار داشتن ششصد و سه سند متنی که در پنج طبقه تقسیم شده بودن فرایند طبقه بندی آغاز شد دراین مقاله از روش وزن دهی ویژگی مبتنی بر اطلاعات کلاس درحوزه طبقه بندی مستندات TFCRF برای انتخاب ویژگیها استفاده شده است نتایج به دست آمده نشاندادکه با درنظر گرفتن روشهای طبقه بندی نزدیکترین همسایه KNN و بیزین Bayesian درروش پیشنهادی بهبود قابل توجهی در طبقه بندی متون فارسی و کاهش مدتزمان تست با ویژگیهای استخراج شده به دست خواهد آمد.