سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۵

نویسنده(ها):

زینب تهجدی – دانشجوی کارشناسی ارشد،گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه
محمد مهدی همایون فر – عضو هیات علمی،گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی ا

چکیده:

تخمین فعالیت های صوتی عبارت است از فرایند دسته بندی سیگنال گفتار به قسمت های گفتار و غیرگفتار با توجه به کاربرد گسترده ی چنین الگوریتم هایی در شاخه های مختلف پردازش گفتار ارایه روشهایی که باعث بهبود این فرایند شوند همواره مد نظر پژوهشگران بودهاست دراین مقاله با استفاده از روش یادگیری میدان تصادفی شرطی و ویژگی های انرژی و اندازه ی همواری طیف مدلی برای تشخیص و جداسازی قسمتهای گفتاری و غیرگفتاری سیگنال صوت ارایه شده است برای بدست آوردنمقادیر بهینه ی پارامترهای روش یادگیری میدان تصادفی شرطی از مجموعه ی دادگان صوتی Aurora استفاده شده و با درنظر گرفتن این مقادیر بهینه و با استفاده از دادگان Timit مدل نهایی ساخته شد و کارایی آن روی دادگان بدون نویز ۹۰/۷۸% برآورد شده است مهمترین مزیت استفاده از روش یادگیری میدان تصادفی شرطی حجم کم دادگان مورد نیاز برای ساخت مدل است مقایسه ی این روش و روش ماشین بردار پشتیبان روی حجم یکسانی از دادگان آموزشی و آزمایشی نشان میدهد که میدان تصادفی شرطی ۱۴/۲۲% بهتر از ماشین بردار پشتیبان عمل کرده و درمقابل نویز نیز پایدارتر است