سال انتشار: ۱۳۹۰

محل انتشار: نوزدهمین کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

هادی جواهری نیا – گروه مهندسی برق, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
فربد رزازی – گروه مهندسی برق, دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
سعید ستایشی – دانشکده مهندسی هستهای ، دانشگاه امیرکبیر

چکیده:

تقسیم بندی سیگنالهای گفتار به حروف واکدار و بیواک و تعیین فرکانس گام در بخشهای واکدار سیگنال گفتار، از اهمیت ویژهای درپردازش سیگنالهای گفتار برخوردار است و در حوزههای متنوعی نظیر سنتز و رمزگذاری سیگنالهای گفتار کاربرد دارد. در این مقاله از روش دوبعدیGCT مبتنی بر استخراج بافت در پردازش تصویر، برای استخراج فرکانس گام گفتار استفاده شده و سعی شده است تا با استفاده ازالگوریتم خوشهبندیK-meansدر حوزه GCT و تصحیح نتیجه خوشه بندی با روش بیشترین نزول، استخراج گام گفتار با دقت بالایی و در شرایط نویزی شدید انجام شود. از ویژگیهای بارز این الگوریتم، میتوان به دقت بالای آن در استخراج فرکانس گام نسبت به دیگر روشهای این حوزه و مقاوم بودن آن نسبت به نویز اشاره نمود.