مقاله استخراج دانش از داده های بیماران دیابتی با استفاده از روش درخت تصمیم C5.0 که چکیده‌ی آن در زیر آورده شده است، در ۱۳۹۲ در مجله دانشگاه علوم پزشکی کرمان از صفحه ۵۸ تا ۷۲ منتشر شده است.
نام: استخراج دانش از داده های بیماران دیابتی با استفاده از روش درخت تصمیم C5.0
این مقاله دارای ۱۵ صفحه می‌باشد، که برای تهیه‌ی آن می‌توانید بر روی گزینه‌ی خرید مقاله کلیک کنید.
کلمات مرتبط / کلیدی:
مقاله دیابت نوع دو
مقاله عوارض دیابت
مقاله داده کاوی
مقاله الگوریتم C5.0
مقاله شبکه عصبی

نویسنده(ها):
جناب آقای / سرکار خانم: عامری حکیمه
جناب آقای / سرکار خانم: علی زاده سمیه
جناب آقای / سرکار خانم: برزگری اکبر

چکیده و خلاصه‌ای از مقاله:
مقدمه: بروز دیابت در ده سال اخیر در سطح جهان دو برابر شده است. حدود ۲۰۰ میلیون نفر به این بیماری مبتلا هستند و سالانه شیوع دیابت در جهان حدود شش درصد افزایش می یابد. بیش از دو میلیون نفر در ایران به این بیماری مبتلا هستند. در این تحقیق به بررسی ارتباط بین عوارض مشاهده شده در بیماران دیابتی نوع دو و برخی ویژگی های آن ها از قبیل میزان قند خون، فشار خون، سن و سابقه خانوادگی بیماران می پردازیم. هدف این مطالعه، پیش بینی عوارض بیماران بر اساس علائم مشاهده شده در آن ها است.
روش کار: داده های مورد نیاز برای این تحقیق از پرونده های سال ۱۳۸۸ مرکز دیابت استان گلستان جمع آوری شده است. تعداد پرونده های اولیه بیماران ۸۵۶ رکورد بود. در این مقاله مدل جدیدی بر اساس متدولوژی استاندارد CRISP ارائه شده است. در بخش مدل سازی از دو روش شناخته شده در داده کاوی به نام های درخت تصمیم C5.0 و شبکه عصبی استفاده شده است. برای تحلیل داده ها از نرم افزار Celementine 12.0 استفاده شده است.
یافته ها: در این تحقیق برای اولین بار احتمال بروز عوارض میکروواسکولار، ماکروواسکولار و یا هر دو نوع عارضه در بیماران و ویژگی های تاثیرگذار بر آن ها مورد بررسی قرار گرفته است. با استفاده از داده کاوی و روش های آن تعیین شده است که متغیر های فشار خون بالا، سن و سابقه خانوادگی در عوارض مشاهده شده بیشترین تاثیر را داشته اند. به کمک درخت تصمیم ایجاد شده، قوانینی استخراج شده اند که می تواند به عنوان الگویی برای پیش بینی وضعیت بیماران و احتمال بروز عوارض در آن ها استفاده شود. صحت مدل ایجاد شده بر روی داده های مورد استفاده در درخت تصمیم C5.0، ۸۹٫۷۴ درصد و در شبکه عصبی مصنوعی ۵۱٫۲۸ درصد می باشد.
نتیجه گیری: با توجه به روش های استفاده شده، بالاترین دقت با استفاده از الگوریتم C5.0 به دست آمده است. بیشترین عوامل تاثیرگذار بر بروز عوارض شناسایی شدند. با توجه به قوانین ایجاد شده برای یک نمونه جدید با ویژگی های مشخص، می توان پیش بینی کرد بیمار احتمالا دچار چه نوع عارضه ای خواهد شد.