سال انتشار: ۱۳۸۲

محل انتشار: یازدهمین کنفرانس مهندسی برق

تعداد صفحات: ۸

نویسنده(ها):

سعید جلیلی – دانشگاه تربیت مدرس گروه مهندسی کامپیوتر
علی آقایی النجق –

چکیده:

با رشد سریع تولید اطلاعات الکترونیکی، لزوم دسته بندی اطلاعات بیشتر از گذشته احساس می شو د. استفاده از نیروی انسانی برای دسته بندی حجم وسیعی از اسناد هم از لحاظ هزینه و هم از لحاظ زمان مقرون به صرفه نیست . برای این منظور رو شهای خودکار دسته بندی متون ارایه شده است . در جامعه محققین، رو شهای آماری نسبت به سایر روشها از توجه بیشتری برخوردار بوده است. در این تحقیق، روش مرکزیت کلاسی تدوین شده است که تا حدودی مشابه روش کلاسیکRocchio می باشد. آزمون های انجام شده براساس زیر مجموعه ای از اسناد رویتر ۲۱۵۷۸ بهبود محسوسی را نسبت به روش Rocchio نشان می دهد و اختلاف کارایی روش مرکزیت کلاسی نسبت به روش SVM که جزء روش های بسیار کارا در دسته بندی متون است بسیار کم است.