سال انتشار: ۱۳۹۱

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

تعداد صفحات: ۸

نویسنده(ها):

عماد عباسی صید آباد – دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد
فواد رحیم زاده تبریزی – دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد
جلیل شیرازی – استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد
مجتبی روحانی – استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد

چکیده:

در بسیاری از خبرگزاری ها، جداسازی صحبت و موزیک به منظور منحصر نمودن صحبت، جهت کاربردهای مربوط به صحبت انجام می شود. در این مقاله با هدف دسته بندی صوت به دو دسته صحبت و موزیک از مدل سازی تبدیل موجک برای صوت استفاده شده و به کمک دو روش ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه دسته بندی شده است. این دسته بندی بر مبنای فاصله زمانی ۱ ثانیه انجام پذیرفته است. نتایج بدست آمده حاکی از کارایی بالا در استخراج ویژگی به کمک تبدیل موجک Bior5.5 همراه با دسته بندی ماشین بردار پشتیبان با میزان خطای ۲/۸۱% می باشد. میانگین خطای دسته بندی در شبکه عصبی پرسپترون چند لایه ۵/۳۱% بدست آمد.