سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

امیر اسمعیل زاده –
افشین مهرابی –
علیرضا زارع فرخادی –
فریبرز محمودی –

چکیده:

به دلیل حجم بالای تراکنشها و پراکندگی اطلاعات در پایگاهدادههای عملیاتی، استخراج گزارشات نیاز به محاسبات و پردازشهای بسیار، بر روی دادهها دارد که این امر باعث کندی استخراج اطلاعات میگردد. از این رو انبار دادهها مورد توجه قرار دارد تا به کمک آن گزارشگیری از اطلاعات انبوه و گسترده تسریع گردد. حال از بین تکنیکهایی که جهت کاهش پردازشها و پیچیدگی موجود در استخراج اطلاعات و پرسوجو ها وجود دارد، ایجاد مدل دادهای ادغام جداول از روشهای مورد توجه میباشد که نتیجه ادغام جداول، مدل دادهای چند بعدی است. از آنجایی که انتخاب ابعاد یک داده چند بعدی در همه جا به طور معمول به صورت دستی و با نظر کارشناسان مربوطه، طی یک پروسه زمانبر انجام میشود، بنابراین هزینه و زمان زیادی برای این کار صرف میشود. از این رو در این مقاله به منظور کاهش هزینه و زمان، روشی ارائه گردیده است که بر اساس کاوش قوانین انجمنی، ابعاد یک داده چند بعدی به طراح انبارداده پیشنهاد میگردد. برای این منظور توسط یک پارسر از تراکنشهای انجام شده بر روی پایگاههایداده، اطلاعات مورد نیاز جهت داده کاوی، استخراج و در نهایت به روش کاوش قوانین انجمنی، قوانینی که نشان دهنده جداول و فیلدهایی که امکان ادغام شدن را دارا میباشند، بدست میآیند.