سال انتشار: ۱۳۹۰

محل انتشار: همایش ملی شهر الکترونیک

تعداد صفحات: ۵

نویسنده(ها):

مریم امیری – دانشجوی کارشناسی ارشد هوش مصنوعی، همدان،دانشگاه بوعلی سینا
حسن ختن لو – عضو هیات علمی، همدان،دانشگاه بوعلی سینا
کاظم فولادی – تهران، دانشگاه تهران، دانشکده برق و کامپیوتر

چکیده:

داده کاوی، شناسایی و پردازش اطلاعات مفید از اسناد می باشد که اساس آن بر مدل نمایش مفهومی اسناد، محاسبه ی شباهت بین اسناد و استفاده از آنها در خوشه بندی و دسته بندی اسناد، بازیابی و استخراج اطلاعات استوار است. در این مقاله روش نوینی برای نمایش آنتولوژیکال اسناد به صورت سلسله مراتبی ارائه شده است. با توجه به آنتولوژی دامنه ی مورد نظر، گراف مفهومی از سند ایجاد می شود که نودهای آن بیان گر مفاهیم و اوزان آنها بیانگر اهمیت مفهوم در سند مربوطه می باشند. جهت یال های گرافت نشان گر ساختار سلسله مراتبی سند و اوزان یال ها بیان گر میزان این رابطه در سند است. با فراهم بودن آنتولوژی و پایگاه داده ی مناسب از لغات هر زبان می توان گفت این روش مستقل از زبان می باشد. نتایج حاصل از این روش به گراف های مفهومی ترسیم شده توسط کارشناسان دامنه مورد نظر نزدیک می باشد و از دقت بالایی برخوردار هستند. استفاده از این روش در بهبود محاسبه ی شباهت بین اسناد و نتایج نهایی داده کاوری تأثیر بسزایی دارد.