سال انتشار: ۱۳۸۶

محل انتشار: اولین همایش ملی مهندسی برق، کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۷

نویسنده(ها):

علیرضا زحلی – گروه کامپیوتر دانشگاه آزاد اسلامی واحد خوراسگان
محسن زند – گروه کامپیوتر دانشگاه آزاد اسلامی واحد دورود

چکیده:

امروزه بسیاری از سازمان ها از انباره داده ای به منظور تحلیل داده ها کمک به اخذ تصمیم های مدیریتی داده کاوی و مدیریت رابطه با مشتری استفاده می کنند مسئله اصلی در این ارتباط آن است که اغلب وجود داده های هرز در انباره داده ای مشاهده می شود در حالت کلی هرز بودن داده به مفهوم نادرستی نبود داده نمایش غیر استاندارد و یا ناسازگاری داده ای است یکی دیگر از جنبه های ی که امروزه در ساخت انباره های داده ای بسیار مورد توجه قرارگرفته است استفاده از XML به منظور جمع آوری داده ها از منابع مختلف می باشد بدین ترتیب یکی از جنبه های بسیار مهم در ایجاد انباره های داده ای XML فرایندپاکسازی و یکپارچگی داده ها است دراین مقاله در ابتدا مدل و آنتولوژی برای هرز بودن داده ها بیان شده و سپس بصورت تفصیلی فرایندی برای پاکسازی و یکپارچگی داده ها ارائه می گردد.