سال انتشار: ۱۳۹۱

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

تعداد صفحات: ۸

نویسنده(ها):

کامران قاصدی – دانشجوی دانشگاه صنعتی امیرکبیر
نجمه صدوقی – دانشجوی دانشگاه صنعتی امیرکبیر
سید علی سید صالحی – استادیار دانشگاه صنعتی امیرکبیر

چکیده:

بازشناسی گفتار با استفاده از ویژگی های تصویری به علت کاربردهای فراوان نظیر بهبود بازشناسی گفتار، لب خوانی و ارتباط رایانه و انسان یکی از موضوعات بدیع و مورد توجه است. برای این منظور در این مقاله ابتدا به پیدا کردن منحنی دور لب پرداخته و سپس با استخراج ویژگی های مطلوب به بازشناسی مستقل از فرد گفتار پیوسته مبادرت می شود. برای یافتن منحنی دور لب، پس از ایجاد فضای زنگی جدید، با استفاده از آستانه گذاری بهینه مرز کلی لب پیدا می شود. سپس با روش پیشنهادی به بهبود الگوریتم یافتن مرز دقیق لب پرداخته و مرزی منعطف و بدون داشتن شرط تقارن بدست می آید. پس از تعریف ویژگی های استخراج شده مطلوب از منحنی دور لب، برای بازشناسی از یک مدل شبکه عصبی که اطلاعات زمینه و نوعی نرمال سازی را به همراه دارد، استفاده شده است. نتایج آزمایشات موید کیفیت و دقت بهتر روش های پیشنهادی نسبت به روش های رایج دیگر است.