مقاله خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری که چکیده‌ی آن در زیر آورده شده است، در زمستان ۱۳۹۲ در مهندسی برق و مهندسی کامپیوتر ایران – ب مهندسی کامپیوتر از صفحه ۸۵ تا ۹۳ منتشر شده است.
نام: خوشه یابی تصویر زیرکلمات در متون قدیمی و حجیم چاپی با استفاده از معیار مقایسه تصویری
این مقاله دارای ۹ صفحه می‌باشد، که برای تهیه‌ی آن می‌توانید بر روی گزینه‌ی خرید مقاله کلیک کنید.
کلمات مرتبط / کلیدی:
مقاله تحلیل اسناد تصویری
مقاله بازشناسی متون حجیم
مقاله خوشه یابی افزایشی
مقاله جداسازی
مقاله مجموعه داده

نویسنده(ها):
جناب آقای / سرکار خانم: سهیلی محمدرضا
جناب آقای / سرکار خانم: کبیر احسان اله

چکیده و خلاصه‌ای از مقاله:
حجم زیاد تصاویر متنی روز به روز مساله دیجیتالی شدن متن تصاویر و همچنین مساله جستجو در این منابع را اهمیت می بخشد. در بازشناسی متن های حجیم می توان از ویژگی هایی مانند محدودبودن تعداد و اندازه قلم، یکسان بودن صفحه آرایی در کل صفحه ها، محدودبودن مجموعه واژه ها و حوزه معنایی آنها و یکسان بودن سبک نگارشی در کل متن استفاده کرد. در این مقاله الگوریتمی ارائه شده که از یکسان بودن نوع و اندازه قلم برای خوشه یابی زیرکلمات یک کتاب قدیمی با کیفیت پایین چاپ استفاده شده است. این کتاب ۲۳۳ صفحه دارد و کل زیرکلمات آن که در حدود ۱۱۱۰۰۰ زیرکلمه است جداسازی و برچسب زنی شده است. در این تحقیق از یک روش ساده افزایشی برای خوشه یابی زیرکلمات استفاده شده است. ابتدا برای هر زیرکلمه چهار ویژگی ساده استخراج می شود، در صورتی که تفاوت این ویژگی ها از ویژگی های نماینده یک خوشه کمتر از مقدار آستانه باشد، مقایسه تصویری بین آن دو انجام می شود. به علت زیادبودن تعداد زیرکلمات سعی شده تا از ساده ترین روش های ممکن استفاده شود تا سرعت اجرا افزایش یابد. نتایج آزمایش ها نشان می دهد می توان زیرکلمات را با دقتی در حدود۹۹٫۷  درصد خوشه یابی کرد. نتایج این خوشه یابی در مرحله بازشناسی زیرکلمات کمک بسیار زیادی خواهد کرد.