سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

نرگس نوروزی – دانشجوی کارشناسی ارشد هوش مصنوعی،دانشکده فنی و مهندسی،دانشگاه الزه
نوشین ریاحی – استادیار گروه آموزشی مهندسی کامپیوتر،دانشکده فنی و مهندسی،دانشگاه

چکیده:

درطراحی بسیاری از سیستمهای تشخیص گفتار پیشین از روش های یادگیری نظارتی جهت آموزش طبقه بندها استفاده شده است که نیازمند مجموعه ی عظیمی از داده های برچسب دار می باشد همانطور که میدانیم دربسیاری از مسائل یادگیری کاربردی موجود در دنیای امروز جمع آوری داده ها برچسب دار امری بسیار مشکل زمان بر و پرهزینه است درحالیکه حجم زیادی از داده های بدون برچسب به آسانی دردسترس بوده ولی روشهای موثر کمتری جهت استفاده از آنها وجود دارد پردازش و آنالیز گفتار یکی از مهمترین مسائلی است که مشکل برچسب زدن داده های آموزشی دراین مطرح است بطوریکه برای برچسب زدن به یک ساعت گفتار حدودا به ۴۰۰ ساعت زمان نیاز داریم به همین دلیل ما دراین مقاله الگوریتم بهبود یافته MCo_Training را به منظور ساخت یک سیستم یادگیری نیمه نظارتی جهت شناسایی حروف مصوت ارایه میدهیم که درآن حجم عظیمی از داده های بدو ن برچسب مورد استفاده قرارمیگیرند نتایج بدست آمده نشان میدهد که کارایی الگوریتم ارایه شده درمقایسه با روشهای یادگیری نظارتی و الگوریتم استاندارد Co_Training بالا بوده و میزان نرخ خطای تشخیص به شکل قابل توجهی کاهش پیدا می کند.