سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

آصف پور معصومی – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کاهانی – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کامیار –
حسین کامیار –

چکیده:

خلاصه سازی خودکار چندسندی روشی برای ارایه فشرده مطالبی است که در ارتباط با یک موضوع بوده ولی جهت دید آنها متفاوت از یکدیگر می باشند خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد دراین مقاله با بهره گیری شکل جدیدی از روش استخراج روابط معنایی موجود درمتن LSIیا LSA و تکنیک برچسب زنی معنایی نقش لغات sRL روشی جدید برای خلاصه سازی چند سندی شدها ست درابتدا با استفاده از ماتریس کلمه – سند به جای ماتریس کلمه – جمله و با بهره گیری از LSA جملات مهم مرتبط با زمینه استخراج می شود درگام بعدی با استفاده از تکنیک sRL و با استفاده از Word NET شباهت معنایی جملات استخراج شده و درنهایت جملات شبیه به هم حذف می شوند نتایج آزمایشها برروی داده های DUC2007 حاکی از افزایش چشمگیر دقت در قیاس با روشهای قبلی مبتنی بر LSA و سیستم های موجود در DUC2007می باشد.