سال انتشار: ۱۳۹۱

محل انتشار: بیستمین کنفرانس مهندسی برق ایران

تعداد صفحات: ۴

نویسنده(ها):

بهنام رضی پرجیکلائی – دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
محمد عشقی – دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

چکیده:

یکی از اجزای اصلی در سیستمهای تبدیل متن به صوت Part-of-Speech (POS) Tagging ،(TTS) است که در زبان فارسی برای تشخیص کسره اضافه نیز بکار می رود. در این مقاله از یک شبکه عصبی مصنوعی Artificial Neural Network)برایPOS Tagging در متون فارسی استفاده شده است. واژه نامه بکار رفته در این مقاله، شامل ۷۲۲۲۶ کلمه ی منحصر به فرد همراه با بردار احتمالtag آن ها است که از یک مجموعه جملات فارسی به همراه POS tag کلمات آن مجموعه، تهیه شده توسط دکتر بی جن خان و دارای تقریبا ۲/۶ میلیون کلمه، استخراج شده اند. شبکه عصبی استفاده شده، از نوعPerceptron و دارای ۲۸۰ نرون در لایه ورودی و ۴۰ نرون در لایه خروجی است و قابلیت تشخیص ۴POS tagدر زبان فارسی را دارد. صحت این شبکه در تشخیصPOS tag کلمات موجود در متون فارسی برابر۹۶/۳۶%است.