تفکیک اطلاعات به مجموعه های آموزش و آزمایش

بدیهی است که اطلاعات جمع آوری شده در مرحله قبل باید شامل کلیه اطلاعات مفید و مؤثر در تصمیم گیری باشد. همچنین این اطلاعات باید در یکجا جمع آوری شده و مجموعه های آموزش و تست به صورت تصادفی از بین آنها انتخاب شوند [۲۲] .فرآیند آموزش داده به شیکه عصبی شامل توجه کردن به همه اطلاعات سودمند و مفید درباره أن مسئله می باشد و استفاده نمودن از این اطلاعات به منظور پیش گویی نمودن یک رفتار یا مشخصات دیگر می باشد.

بنابراین برای تولید نمودن مجموعه های آموزش و آزمایشی باید همه اطلاعات را در نظر گرفت. در حالت کلی برای شبکه های عصبی، مجموعه آموزش ایده ال را برای هر کدام از خروجی های ممکن ایجاد کنند. ولی این موضوع غالباً امکان پذیر نیست. بر این اساس محققان در مسایل شبکه های عصبی ۳۰-۲۰ درصد از کل داده ها را به عنوان مجموعه آزمایشی و ۸۰-۷۰ درصد را به عنوان مجموعه آموزش در نظر می گیرند ۲۳، ۲۴]. در این مقاله ۷۵ درصد (۳۰۰ مورد) برای مجموعه آموزش و ۲۵ درصد (۱۰۰ مورد) دادهها برای مجموعه تست استفاده شده است.

انتخاب معماری مناسب برای شبکه

شبکه های پرسیترون چند لایه با آموزش پس انتشار عموماً به عنوان نمونه ای از شبکه های استاندارد برای مدل سازی پیش بینی و طبقه بندی در نظر گرفته می شوند. گزینش یک معماری بهینه در شبکه های عصبی، یکی از حوزه های تحقیقاتی است که هنوز هم محققان در مورد آن در حال پژوهش می باشند و به طور کلی محققان بر روی معماری ایده آل شبکه توافق ندارند و در مورد تعداد لایه میانی و نرون های داخل هر لایه، نظرات متفاوتی وجود دارد. به عنوان مثال کاسترا (KaaStra) و میلتون (Milton) در تحقیقات خود نشان دادند که وجود یک لایه میانی در شبکه های عصبی قادر است غالب توابع و مسائل را به شیوه ای مناسب مدل سازی نماید. همچنین در این تحقیق نشان دادند که تعداد نرون این لایه بهتر است حداکثر برابر ریشه دوم حاصل ضرب تعداد نرون ورودی در تعداد نرون خروجی باشد [۲۵].

نحوه کار شبکه عصبی پرسپترون چند لایه با آموزش پس انتشار، اساساً از دو مسیر اصلی تشکیل می شود. در مسیر رفت بردار ورودی به شبکه اعمال و تأثیرهای آن از طریق لایه های میانی به لایه های خروجی انتشار می یابد. بردار خروجی تشکیل یافته در لایه خروجی پاسخ واقعی شبکه را تشکیل می دهد. در این مسیر پارامترهای شبکه ثابت و بدون تغییر در نظر گرفته می شوند. در مسیر برگشت پارامترهای شبکه تغییر و تنظیم می شوند. این تنظیمات مطابق با قانون اصلاح خطا انجام می گیرد. بردار خطا برابر اختلاف بین بردار پاسخ مطلوب و پاسخ واقعی می باشد. مقدار خطا پس از محاسبه در لایه خروجی از طریق لایه های شبکه، در کل شبکه توزیع می شو. در این توزیع خطا، پارامترهای شبکه طوری تنظیم می شود که پاسخ واقعی شبکه به پاسخ مطلوب نزدیکتر شود. برای تعیین معماری شبکه باید توابع فعالیت نرون ها، قواعد یادگیری، تعداد لایه های مخفی، تعداد نرون ها در هر لایه و نرخ یادگیری در هر لایه مشخص شود.