سال انتشار: ۱۳۸۱

محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۵

نویسنده(ها):

محمدمهدی همایون پور – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری دانشکده مهندسی کامپیوتر دان
ذبیح اله احمدپور – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری دانشکده مهندسی کامپیوتر دان
جهانشاه کبودیان – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری دانشکده مهندسی کامپیوتر دان

چکیده:

تشخیص اعدادی که بصورت گفتاری بیان شده باشند بدلیل مورد استفاده بودن در بسیاری از کاربردها از جمله اعلام شمارۀ شناسائی شخصی، شمارۀ حساب بانکی یا شمارۀ عضویت برای کاربران یک سیستم خدمات رسانی، ارتباط با بانک اطلاعاتی ا ز راه دور، ثبت نام دانشجویان از طریق تلفن یا اینترنت و مانند آن بسیار حائز اهمیت می باشد . بازشناسی گفتار و از آن جمله بازشناسی اعداد
چنانچه از راه دور و از طریق تلفن بیان شده باشند بدلیل تأثیرات ناشی از دهنی تلفن و نیز خطوط مخابراتی از پیچیدگی و ویژگی های خاص خود برخوردارمی باشد . مدل مخفی مارکف و شبکه های عصبی، روش هایی هستند که مبنای اغلب سیستم های بازشناسی گفتار را تشکیل می دهند و هر کدام از این روش ها در مواردی دارای ضعف می باشند . در این مقاله، بازشناسی اعداد پیوستۀ فارسی که از طریق تلفن و بصورت نامقید و نیز مستقل از گوینده بیان شده باشند، توسط مدل مخفی مارکف با چگالی احتمال پیوسته، شبکۀ عصبی پرسپترون چندلایه و ترکیب مدل مخفی مارکف و شبکۀ عصبی مورد نظر می باشد . مقایسه بر حسب نرخ بازشناسی واج و کلمه انجام می گیرد . دو نوع ویژگی مورد استفاده قرار گرفته است . نوعی الگوریتم برنامه ریزی پویا برای استخراج اعداد از رشته واج های بازشناسی شده، بکار برده شده است و نتایج بازشناسی اعداد حاصل از سه روش با هم مقایسه شده اند .