سال انتشار: ۱۳۹۰

محل انتشار: چهارمین کنفرانس مهندسی رسانه

تعداد صفحات: ۶

نویسنده(ها):

مائده مقدم – دانشگاه آزاد قزوین
اعظم باستان فرد – دانشگاه آزاد اسلامی واحد کرج

چکیده:

آوادید کوچک ترین واحد قابل تمایز گفتار تصویری است و تعیین کلاس های آوادیدی در هر زبان یکی از گام های اولیه در تحقیقات صورت گرفته بر روی بازشناسی گفتار تصویری، پویانمایی صورت و بهبود نرخ بازشناسی گفتار صوتی است. در این مقاله یک روش – مستقل از گوینده و قوی جهت حل مساله خوشه بندی آوادید واکه های زبان فارسی ارائه شده است. روش ارائه شده شامل سه فاز اصلی است: ۱- پیش پردازش، ۲- استخراج ویژگی، ۳ – خوشه بندی سلسه مراتبی. در این روش، پس از آنکه ناحیه دهان در تمامی فریم ها قطعه بندی شد، بردار ویژگی با به کارگیری مدل مخفی مارکوف استخراج میشود. استفاده از مدل مخفی مارکوف به عنوان یک استخراج کننده ویژگی از جنبه های نوآوری این مقاله است. در نهایت با اعمال خوشه بندی سلسه مراتبی، آوادید واکه های زبان فارسی خوشه بندی می شوند. مهمترین مزیت این روش استقلال خوشه های آوادیدی از گوینده است. روش ارائه شده بر روی مجموعه دادگان آوا ۲ اعمال شد.