سال انتشار: ۱۳۹۱

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

تعداد صفحات: ۴

نویسنده(ها):

هادی سمائی رهنی – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد، گروه برق
جلیل شیرازی – استادیار دانشگاه آزاد اسلامی واحد گناباد، گروه برق
هادی جوان – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد گناباد- گروه برق

چکیده:

در این مقاله یک روش برای شناسایی گوینده ناوابسته به متن ارائه شده است. تعداد ۲۲ گوینده ) ۱۲ گوینده مرد و ۱۲ گوینده زن( از بانک اطلاعاتی TIMIT انتخاب شده و برای هر گوینده ۱۲ جمله استفاده شده است. گفتار گویندگان به قابهای ۲۲ میلی ثانیه تقسیم شده و برای هر قاب ۱۳ ضریب MFCC به عنوان بردار ویژگی آن قاب محاسبه شده واز ماشین بردار پشتیبان SVM SVM برای دسته بندی گویندگان استفاده شده است. دسته بندی کننده های SVM را با بردارهای ویژگی قابها آموزش داده و برای دسته بندی گویندگان قابهای گفتار گوینده مجهول به SVM هااعمال می شوند. دسته بندی را از روی ۱۲۲ قاب متوالی، معادل یک ثانیه، انجام شده است و خطای ۱٫۸ درصد بدست آمده است.