سال انتشار: ۱۳۹۴

محل انتشار: اولین همایش ملی کامپیوتر، فناوری اطلاعات و ارتباطات اسلامی ایران

تعداد صفحات: ۱۱

نویسنده(ها):

فاطمه تاج آبادی فراهانی – دانشگاه آزاد اسلامی ،دانشکده فنی مهندسی، واحد اراک،گروه کامپیوتر، اراک،ایران

چکیده:

مسئله شناسایی گوینده ، فازهای مختلفی دارد که مهمترین فاز آن استخراج ویژگیهاست و عملکرد کلی سیستم به آن وابسته است.این مقاله به مسئله شناسایی وابسته به متن گوینده به کمک تکنیکهای پردازش تصویر برروی تصاویر اسپکتوگرام میپردازد. روشسیفت که یکی از روشهای مرسوم در پردازش تصویر می باشد برای استخراج ویژگی های منحصر به فرد گوینده که در الگوی تصاویر اسپکتوگرام موجود است پیشنهاد شده است،که به دلیل خواص منحصر به فرد آن از جمله مقاومت در برابر چرخش و تغییر ابعاد تصویر، یکی از بهترین روشهای استخراج ویژگی میباشد. کلیه روشهای این مقاله با زبان MATLAB پیادهسازی شدهاند. برای ارزیابی عملکرد روش پیشنهادی، از پایگاه داده صوتی Hyke ارائه شده توسط ماکروسافت در دانشگاه دهلی استفاده شده است. نتایج نشان میدهد که نرخ شناسایی گوینده روش پیشنهادی ۹۱/۴۷ درصد میباشد. همچنین ابعاد بردار ویژگی وزمان شناسایی در مقایسه با روش های دیگر کاهش چشم گیری یافته است