سال انتشار: ۱۳۹۰

محل انتشار: چهارمین کنفرانس مهندسی رسانه

تعداد صفحات: ۵

نویسنده(ها):

محسن سبزی نژاد – کارشناسی ارشد الکترونیک، دانشگاه آزاد اسلامی واحد علوم و تحقیقات ،ت
حسین بهبود – کارشناسی ارشد مهندسی پزشکی – بیوالکتریک ، دانشگاه امیرکبیر ،تهران،ای

چکیده:

در این مقاله یک روش برای بهبود بازتشخیص گفتار در انسان با استفاده از داده های صوتی و موقعیت اعضاء تولید گفتار به صورت همزمان مورد مطالعه و بررسی قرار گرفته است . در این شیوه ابتدا هر دو دسته اطلاعات صوتی و موقعیت اعضاء تولید گفتار به یک مدل شبکه عصبی جلو سو زمانی جهت بازتشخیص داده می شود و نتایج حاصله رشد کیفیت بازتشخیص ۱۳ % را نشان می دهد . در مدل دوم اطلاعات موقعیتی برای داده های آزمون از اطلاعات صوتی ، توسط یک مدل شبکه عصبی نگاشت معکوس تخمین زده می شود. نتیجه حاصل از این مدل %۹ بهتر شدن کیفیت را در حالت جدید نشان می دهد و نتایج حاصل از این مدل با روش های دیگر به طور کلی مقایسه شده است.