سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

حسین کامیار – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کاهانی – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
محسن کامیار – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد
آصف پور معصومی – آزمایشگاه فناوری وب،دانشگاه فردوسی مشهد

چکیده:

دراین مقاله یک تکنیک جدید برای خلاصه کردن یک متن با توجه به ویژگیهای زبانی عناصر موجود درمتن و زنجیره های معنای میان آنها ارایه شده است در بسیار یاز روشهای موجود خلاصه سازی متون تمامی توجه به ویژگیهای آماری عناصر متن می باشد دراین جا با استفاده از نظریه مرکزیت که زنجیره های انسجام درداخل متن را تشخیص میدهد یک روش جدید خلاصه سازی خودکارمتن ارایه می شود برای پردازش متن توسط نظریه مرکزیت و استخراج یک خلاصه ی منسجم احتیاج به درهم آمیختن تعدادی از ابزارهای پردازش متن شامل روش جایگزینی ضمایر و گروه های اسمی با مرجع اسمی آنها Coreference Resolution روش برچسب زنی نقش گرامری اسامی در داخل یک جمله Semantic Role Labeling و روش برچسب زنی گروه های اسمی POS Tagger می باشد دراین مقاله نتایج تجربی به دست آمده از اعمال نظریه مرکزیت برای خلاصه سازی متون برروی یک پیکره ی خلاصه سازی ارایه میگردد با ارزیابی روشهای خلاصه سازی موجود و الگوریتم پیشنهادی برروی این پیکره می توان به میزان افزایشکارایی و کیفیت حاصل شده پی برد