اسماعیل فرامرزی

اسماعیل فرامرزی

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

بازشناسی نوری حروف: مروری بر مباحث نظری و ملاحظات کاربردی با تأکید بر مسائل خاص زبان فارسی

کلید واژه ها: پردازش تصویر بازشناسی نوری حروف («اُسی‌آر» ) تجزیه و تحلیل تصویر مدرک شناسایی الگوی آماری

حوزه های تخصصی:
تعداد بازدید : ۱۱۵۲ تعداد دانلود : ۹۱۰
در این مقاله مبانی نظری و جنبه‌های کاربردی مبحث بازشناسی نوری حروف (اُسی‌آر) بصورت جامع مورد بررسی قرار می‌گیرند و زیربخش‌ها و بلوک‌های پردازشی آن معرفی می‌گردند. همچنین خصایص و پیچیدگی‌های مختص نگارش زبان فارسی که یک نرم‌افزار «اُسی‌آر» باید آن‌ها را در عملیات پردازشی خود لحاظ نماید، بیان خواهند شد. تحقیقات داخلی انجام‌شده در زمینه «اُسی‌آر» مورد اشاره قرار خواهند گرفت؛ نرم‌افزارهای معروف تجاری «اُسی‌آر» لاتین و فارسی معرفی، و قابلیت‌ها و نقاط قوت و ضعف آن‌ها تشریح می‌شوند. در آخر هم پیشنهادهایی در راستای انتخاب راهکارهای مناسب به منظور تسریع در حصول یک نرم‌افزار «اُسی‌آر» کارآمد برای زبان فارسی ارائه می‌گردد. مخاطب این مقاله، دانش‌آموختگان رشته‌های فنی و غیرفنی هستند که قصد دارند درباره این حوزه اطلاعات مقدماتی کسب نمایند. ازاین رو از جنبه‌های محاسباتی و ریاضیات مسئله چشم‌پوشی شده است.
۲.

تشخیص خودکار صفحات فهرست با توجه به الگوی آنها در پایان‌نامه‌های فارسی و لاتین

کلید واژه ها: پردازش تحلیل تصویر مدارک (دی‌آی‌ای) تحلیل پیکربندی صفحات تحلیل ساختاری مدارک تحلیل منطقی مدارک درک تصویر مدارک شناسایی صفحات فهرست

حوزه های تخصصی:
تعداد بازدید : ۱۰۴۹ تعداد دانلود : ۵۸۵
صفحات فهرست در هر نوع مدرک (کتاب، مجله، پایان‌نامه، ...)، به نحو مختصر و فشرد‌ه، ساختار منطقی آن مدرک را بیان می‌کنند و به کمک آن‌‌ها می‌توان به راحتی ساختار مدرک را مشاهده نمود و مستقیماً به مطالب مورد نظر دست یافت. در این مقاله برای اولین بار روشی به منظور شناسایی خودکار صفحات فهرست در پایان‌نامه‌‌های فارسی، عربی و لاتین ارائه می‌شود. در این روش، شناسایی صفحات فهرست با توجه به الگوی آن‌‌ها بدون استفاده از عملیات بازشناسی متن (اُسی‌آر) و تنها با به‌کارگیری فنون پردازش تصویر، مد نظر بوده. با این روش می‌توان صفحات فهرست را صرف نظر از نوع زبان و ترازبندی (راست به چپ یا چپ به راست بودن) متن آن‌‌ها، شناسایی کرد و به دلیل عدم استفاده از اُسی‌آر، تابع کیفیت متن مدرک اسکن‌شده نیست. روش مذکور بر روی دسته‌ای از پایان‌نامه‌‌های فارسی، عربی و لاتین موجود در پایگاه اطلاعاتی پژوهشگاه اطلاعات و مدارک علمی ایران مورد آزمایش قرار گرفت و دقت 7/99 درصد در بازشناسی صحیح حاصل گردید.

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان