سال انتشار: ۱۳۸۰

محل انتشار: چهارمین کنفرانس دانشجویی مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

محمد محمودی قیداری – دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
امین کرباسی – آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر
فربد رزازی – آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

چکیده:

دراین مقاله مدلی آماری برای دنباله های فونتیکی گفتار فارسی ارائه شده است با توجه به اینکه در زبان فارسی به مدلسازی زبانی کمتر پرداخته شدهاست اینم وضوع می تواند به کاهش احتمال خطای سیستم های بارشناسی کمک شایانی کند مبنای این مدلسازی مدل n-gram با روش هموارسازی درون یابی بوده است سیستم پیاده سازی شده برای مدلهای ۱-gram,2-gram,3-gram,4-gram آزموده شده است و بهترین نتیجه برای ۴-gram با هموارسازی درون یابی به ازای ضریب ثابت ۰/۹ بدست آمده است که کمترین پیچیدگی ۳٫۷۳ به دست آمده است.