سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

محمد امین مهر علیان – دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر،ت
شهرام خدیوی – دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر

چکیده:

یادگیری ماشین ها با رویکرد با ناظر امروزه پایه ی بسیاری از فعالیت های مختلف درحوزه پردازش زبان طبیعی است اگرچه این روشها به موفقیت هایی دست یافته اند اما در مقابل نیازمند فراهم شدن حجم زیادی از داده آموزشی توسط یک تفسیر کننده مانند انسان است که گاها هزینه هایی بالایی را دربرخواهد داشت علاوه بر این دربیشتر روشهای یادگیری با ناظر ترتیب انتخاب نمونه های آموزشی براساس تصادف صورت میگیرد درمقابل برای برطرف کردن مشکلات مذکور یادگیری فعال مطرح می شود که در آن به شکلی تکرار شونده نمونه هایی با بیشترین اثر مطلوب برفرایند آموزشانتخاب می شوند نتایج آزمایشات نشان میدهد در آموزش یک مدل برچسب زنی دنباله فارسی براساس پیکره متنی زبان فارسی تنها با استفاده از ۹٫۳۶% از کل داده های آموزشی به دقت برچسب زنی تا ۹۶٫۲۸% رسید و این درحالی استکه دقت برچسب زنی با بکارگیری کل نمونه ها ۹۶٫۴۵% می باشد