سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

علیرضا اسماعیلی – دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر
سیدمحمد احدی –
میرابوالحسن فصیحی –

چکیده:

در این مقاله طرح یک آشکارساز فعالیت گفتاری جدید که می تواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا و نسبت سیگنال به نویز پایین کار کند مورد بررسی قرار می گیرد. امروزه در بسیاری از کاربردهای پردازش گفتار همانند وسایل کمک شنوایی، بازشناسی گفتار، کدینگ و … برای کاهش تأثیر مخرب نویز بر عملکرد سیستم از سیستم های بهسازی گفتار استفاده می شود. در این سیستم ها معمو ً لا از آشکارساز فعالیت گفتاری(Voice Activity Detector برای تشخیص فریم های فاقد گفتار و سپس تخمین طیف نویز از روی آنها استفاده می شود. در این تحقیق از یک سیستم بهسازی گفتار پیش از بکارگیری VAD استفاده شده و خروجی VAD مجددًا در همین سیستم بکارگرفته می شود. در این راستا از سیستم بهسازی گفتار Malah و Ephraim برای تخمین MMSE طیف سیگنال و افزایش نسبت سیگنال به نویز در سیگنال ورودی استفاده شده است. سپس معیار تصمیم گیری VAD از محاسبه دیورژانس طیفی بلندمدت سیگنال ارتقا یافته Enhanced Long Term Spectral (Divergence- E-LTSD بدست می آید. نشان داده شده است که استفاده از اطلاعات بلند مدت طیف سیگنال در بهبود عملکرد VAD موثر است. سپس برای اینکه سیستم بهسازی گفتار بتواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا کار کند، طیف نویز را در فریم های فاقد گفتار به روز می کنیم