سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

مسلم محمدی –
مرتضی آنالویی –
بهروز مینایی بیدگلی –

چکیده:

در این مقاله یک روش مبتنی بر رده بندی و وز ندهی کلمات برای پاس خدهی به سوالات در حوزه زندگی نامه پیشنهاد شده است. با استفاده از یک پیکره از پاس خهایی که به صورت دستی استخراج شد هاند، کلمات فنی در این حوزه، تعیین م یشوند و سپس این کلمات وزن دهی شده و برای رد هبندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این حوزه انواع سوالات را به سوالات در زمینه " ناریخ ولادت" ،" تاریخ وفات" ، "محل ولادت"، "محل وفات" ویا ترکیبی از آنها محدود کرده ایم. ابتدا پرسش به زبان طبیعی در زمین ههای ذکز شده پرسیده م یشود و سپس نوع سوال با توجه به کلمات به کار رفته در آن و کلمات فنی هر نوع سوال، تعیین می شود. در مرحله بعدی اسناد مرتبط با پرسش استخراج شده و به قطعات کوچکتر شکسته می شود. در این مرحله، جملات موجود در قطعه مت نها، رده بندی شده و جملات ه منوع با پرسش، استخراج شده و میزان مشابهت آن با پرسش ارزیابی می گردد. در انتها جملاتی که بیشترین مشابهت را دارند به عنوان پاسخ برگردانده م یشوند. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان بازخوانی پائین بوده ولی میزان دقت خیلی امیدوار کننده است