سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

حسن بشیری – مدرسدانشکده مهندسی کامپیوتردانشگاه بوعلیسینا
فاطمه کربلایی – دانشجوی کارشناسی نرمافزاردانشگاه بوعلیسینا
شیرین موسوی – دانشجوی کارشناسی نرمافزاردانشگاه بوعلیسینا

چکیده:

استفاده از نمایههای تهیه شده از اسناد، مهمترین معیار جستجو و تشخیص اسناد مرتبط به پرسش کاربر در سیستمهای بازیابی اطلاعات است. از این رو تهیه خودکار نمایههای متن یکی از مسایل پایهای و ضروری در سیستمهای بازیابی اطلاعات است. در مقاله حاضر با توجه به مطالعات انجام گرفته در روند نمایهسازی در روشهای دستی و کامپیوتری، نمایهساز خودکار سینا برای متون فارسی طراحی و پیادهسازی شده است. همچنین ریشهیاب خودکاری برای سینا طراحی شده است که به منظور کاهش حجم نمایه و استفاده از ریشه کلمات فارسی در محل نگهداری نمایهها به جای نگهداری همه واژهها استفاده میشود. به منظور وزندهی به نمایههای ایجاد شده توسط سینا از چهار روش وزندهی استفاده شده و مورد ارزیابی قرار گرفته است. در پایان ریشهیاب و نمایهساز خود را مورد ارزیابی قرار دادهایم.