سال انتشار: ۱۳۸۹

محل انتشار: شانزدهمین کنفرانس بین المللی سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

محمدرضا فیضی درخشی – گروه کامپیوتر دانشگاه تبریز
آزاده روحانی – دانشگاه آزاد اسلامی واحد شبستر،گروه کامپیوتر،شبستر،ایران
مهسا صباغ نوبریان – دانشگاه آزاد اسلامی واحد شبستر،گروه کامپیوتر،شبستر،ایران

چکیده:

نحوههای مختلف ورود اطلاعات باعث بهوجودآمدن رکوردهای تکراری میشود که این امر باعث افزایش حجم پایگاهدادهها میگردد.در این مقاله، روشی به نام تطابق وزندار پیشنهاد شدهاست تا تطابق بین فیلدها و رکوردها معقولتر انجام شود. برخی از روشهای موجود روی کلمات یک بخشی به خوبی عمل میکنند ولی کاربرد خوبی در کلمات چندبخشی ندارند ولی روش تطابق وزندار کارایی خوبی برای کلمات چندبخشی دارد و درجه شباهت بالایی را برای اینگونه فیلدها دارا است و از آنجایی که بیشتر عد م تشابه ها وابسته به خطاهایی است که بر اثر ورود اشتباهی حروف مشابه بهوجود آمدهاست، این روش با درنظر گرفتن شباهتی برای حروف مشابه، دقت را در خطاهای تایپی بالا میبرد. همچنین این روش حساسیتی نسبت به کاراکترهای شبیه به هم دارد . از آنجایی که مقادیر نامعتبر فیلدها تاثیر زیادی روی تطابق رکوردها دارد، این روش اثرات این نوع فیلدها را کمتر در نظر میگیرد تا دقت معقول- تری بهدست بیاید. بعداز بیان و بررسی روش تطابق وزندار، آزمایشهایی با این روش و روشهای موجود روی دو پایگا ه داده واقعی انجام شد و نتایج آن مورد مقایسه و بررسی قرار گرفت که این روش بر روی پایگاهدادهها دقتی درحدود ۹۰ درصد داشت که مابین ۶ تا ۸ درصد نسبت به بهترین حالت بهبود نشان میدهد