سال انتشار: ۱۳۹۴

محل انتشار: اولین همایش ملی کامپیوتر، فناوری اطلاعات و ارتباطات اسلامی ایران

تعداد صفحات: ۱۲

نویسنده(ها):

یونس نوروزی – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد ایلام،
محمدرضا ولی زاد – استادیار دانشگاه آزاد اسلامی واحد ایلام

چکیده:

دراین مقاله به بیان این می پردازیم که با توجه رشد بسیار زیاد اطلاعات وداده ها ، خلاصه سازی خودکار متن، یک روش کاربردی ومورد علاقه است.این روش به کوتاه کردن محتوای اطلاعاتی یک فایل متنی با حفظ محتوای اصلی در معنای کلی اشاره می کند.خلاصه سازی چندین سند ، برای انسان کاری بسیار سخت و دشواری است . یکی از مشکلاتی که امروز وجود دارد، وجود وب سایت هایی است که باعث رشد سریع و حجم بالای اطلاعات شده اند که این امرضرورت خلاصه سازی قوی ، قدرتمند و پیچیده برای کاهش حجم اطلاعات و افزایش سرعت دسترسی را بیشتر می کند.در اینمطالعه )پایان نامه( سیستم خلاصه ساز متن پیشنهادی پس از ریشه یابی کلمات با استفاده از ترکیب روشها مبتنی بر گراف و TF-IDF ،جملات را وزن دهی می نماید . در مرحله خلاصه سازی، استخراجی در این روش جملات و پاراگراف های مهم ، از متن اصلی انتخاب شده ، به یکدیگر الحاق شده وبه شکل کوتاه تر در می آید. جملات مهم ، براساس ویژگی های آماری و زبان شناختی انتخاب می شوند. در این روش معمولا تاکیدبر تعیین جملات برجسته و ارتباط آماری و واژگانی با الگوهای عبارتی است. سپس در روش دوم این روش با استفاده از تکنیک های زبان شناختی به بررسی و تفسیر متن پرداخته و مفاهیم اصلی را در می یابد ، پس با تولید یک متن جدید و کوتاه تر که انتقال دهنده و توصیف کننده اطلاعات اصلی سند است ، خلاصه ی آن را ایجاد می نماید