سال انتشار: ۱۳۸۹

محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۵

نویسنده(ها):

علی اصغر بهمنش – گروه کامپیوتر – دانشگاه بوعلی سینا
امیر سالارپور – گروه کامپیوتر – دانشگاه بوعلی سینا
عبدالحمید پیله ور – گروه کامپیوتر – دانشگاه بوعلی سینا همدان

چکیده:

یکی از اقدامات اساسی در حوزه پردازش زبانهای طبیعی برچسب زنی کلمات می باشد.برچسب ها در حوزه های پردازش گفتار (تبدیل متن به گفتار و برعکس), ماشین مترجم ] ریشه یاب ها و دیگر کاربردهی پردازش زبان استفاده می شود .در این مقاله سعی شده است تاکلمات به وسیله تکنیک های آماری روی پیکره فارسی بیجین خان به درستی برچسب گزاری شوند.روش های آماری یکی از ابتدایی ترین روش برچشب زنی استکه علاوه بر سادگی , دقت قابل قبولی نیز دارد.برای اینکه برچسب صحیحی به کلمات داده شود.لازم است کلمات از نظر ساختاری مورد بررسی و پردازش قرار بگیرند. به همین دلیل قبل از برچسب زنی کلمات , ساختار کلمه از لحاظ پیشوندی و پسوندی پیش پردازش شده اند و برچسب با توجه به وندهای موجود در کلمه انتخاب می شود.بنابراین دقت برچسب زنی افزایش می یابد.روش ارائه شده در این مقاله ۹۶٫۰۷% صحت را برای برچسب زنی روی پیکره نشان می دهد که نسبت به روش های مشابه دقتی بهتری دارد.