سال انتشار: ۱۳۸۹

محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۵

نویسنده(ها):

بابک مسعودی – گروه کامپیوتر – دانشگاه آزاد اسلامی واحد مشهد
سعید راحتی قوچانی – گروه برق – دانشگاه آزاد اسلامی واحد مشهد
اعظم استاجی – گروه زبانشناسی – دانشگاه فردوسی مشهد

چکیده:

در هر زبان کلماتی مبهم وجود دارند که دارای چند معنی متفاوت هستند و با بدلیل دارا بودن ساختار نوشتاری یکسان و تلفظ متفاوت (هم نویسه) مبهم به شمار می ایند.انتساب اتوماتیک معنی صحیح یک کلمه , از مسائل جاری در حوزه پردازش زبانهای طبیعی محسوب می شود.در این مقاله با در نظر گرفتن خصوصیات نوشتاریزبان فارسی , یک روش مبتنی بر پیکره جهتیافتن معنی صحیح کلمات پیشنهاد شده است.بر این اساس ویژگی کلمه ونشانه هایی که بلافاصله قبل و بعد از کلمه مبهم بکار رفته اند , علاوه بر ویژگی سبد لغات همراه هر معنی کلمه , به منظور رفع ابهام , مورد استفاده قرار گرفته است. نتایج دسته بندی با استفاده از یک روش بیزی (Naïve Bayes) تغییر یافته برای تعدادی از کلمات مبهم زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علایم استخراج شد, نشان می دهد استفاده از ویژگیهای مذکور در مقایسه با روش هایی که تنها از سبد لغات استفاده می کنند , باعث بهبود دقت بازشناسی می شود.