سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

رضا صحرائیان – دانشکده مهندسی برق،دانشگاه علم و صنعت،ایران
بهزاد زمانی – دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت ایران،تهران
احمد اکبری –
احمد آیت اللهی –

چکیده:

روش رگرسیون خطی با بیشینه درست نمایی MLLR) یکی از روشهای تطبیق گویندهاست که با خوشه بندی پارامترهای مدل و تخمین ماتریس تبدیل برای هر خوشه و اعمال تبدیل برپارامترهای مدل باعث بهبود عملکرد تطبیق و درنتیجه افزایش نرخ بازشناسی برای گوینده جدید می شود خوشه بندی پارامترهای مدل معمولا بدوصوت انجام می شود براساس دانش آوایی و نزدیکی ویژگیها در فضای آکوستیکی، دراین مقاله با استفاده از روش متمایز سازی خطای کمینه کلاس بندی با متمایز کردن ویژگیهای سیگنال گفتار با بهبود کلاس بندی کارایی روش MLLR) بهبود یافته است این بهبود در حالت اول با متمایز کردن کلاسهای رگرسیون و درحالت دوم با یکنواخت کردن توزیع مخلوط های گوسی در کلاسهای رگرسیون ایجاد می شود روش پیشنهادی یعنی بکارگیری خطای کمینه کلاسبندی نسبت به روشهای معادل بدون خطای کمینه کلاسبندی به ترتیب باعث افزایش نسبی ۰٫۴۲% تا ۰٫۵۸% و ۰٫۱۲% تا ۰٫۷۲% درنرخ بازشناسی واج به ترتیب برای دادگان WSJTIMIT می گردد درحالتی که درخت کلاس رگرسیون براساس نزدیکی ویژگیها در فضای آکوستیکی ساخته شده است نرخ بازشناسی واج برروی دادگان TIMIT 0.25% افزایش نسبی یافته است.