سال انتشار: ۱۳۹۰

محل انتشار: دومین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

تعداد صفحات: ۶

نویسنده(ها):

نسیم چقاقاسمی – دانشجوی کارشناسی ارشد الکترونیک

چکیده:

گفتار دارای ویژگیهای بسیاری است که استخراج دقیق آنها می توانددرصحت بازشناسی گفتار نقش بسیار موثری داشته باشد دراین زمینه محققان بسیاری با بررسی این ویژگیها وارایه روشهای مختلف به بهبود صحت بازشناسی و شناسایی حالت گفتار پرداخته اند از جمله این ویژگیها می توان به ضرایب MFCC انرژی و فرکانسهای فرمنت و فرکانس گام اشاره نمود که نقش بسیار مهمی در سیستمهای شناسایی حالت گفتار دارنددراین مقاله به اثر این ویژگیها دربازشناسی حالت گفتار پرداخته می شود و چهارحالت عصبی angry خوشحالی happy طبیعی natural و سوالی question موردآزمایش قرارمیگیرند دراین تحقیق ویژگیهای مختلفی از گفتار به صورت بردار حاوی ۵۵ ویژگی مورد بررسی قرار میگیرد درمرحله ی بعد به کم ک الگوریتم بهینهسازی PSO بردارهای ویژگی ۴۹ و ۲۴ و ۱۵ تایی بدست می آید که هرچه بردارهای مورد استفاده از ویژگیهای کمتری تشکیل شده باشند سرعت عمل را بالاتر می برند سپس روشهای بهینجارسازی متوسط واریانس و بهره ی کپسترال روی این بردارها به کار گرفته می شوند و با استفاده از الگوریتم GMM بازشناسی حالت گفتار روی بردارهای بهنجار شده صورت میگیرد.