محدثه رهنما

محدثه رهنما

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

ارائه روشی برای برچسب زدن تصاویر موجود در متون علمی فارسی با استفاده از روش های پردازش متن(مقاله علمی وزارت علوم)

کلید واژه ها: برچسب زدن تصویر نشانه گذاری تصویر بازیابی تصویر پردازش متن استخراج فراداده فناوری اطلاعات

حوزه های تخصصی:
تعداد بازدید : ۳۲۹ تعداد دانلود : ۱۳۰
در این مقاله یک روش جدید برای برچسب گذاری تصاویر موجود در متون علمی فارسی معرفی می شود. در اسناد و مقالات علمی، تصاویر حاوی اطلاعلات مهمی هستند و در بسیاری از موارد به تنهایی با بررسی آن ها می توان به ایده اصلی و یا نتایج مهم مقاله علمی پی برد، بدون اینکه لازم باشد کل مقاله را مطالعه کرد. به خاطر رشد روزافزون داده های تصویری، بازیابی تصاویر از اسناد علمی توجه زیادی را به خود جلب کرده و به یک موضوع روبه رشد در ادبیات تبدیل شده است. اولین قدم در بازیابی تصاویر تخصیص برچسب های توصیف کننده به هر تصویر است. در اینجا برای استخراج برچسب تصویر از متن سندی که تصویر به آن تعلق دارد، استفاده شده است. زیرنویس و قسمتی از متن سند که در آن به تصویر مورد نظر اشاره شده است، در نظر گرفته می شود. عبارات اسمی در متنِ همراه تصویر با استفاده از پنج روش متفاوتِ فراوانی عبارات در سند، معکوس فراوانی سند، فراوانی کلمه-معکوس فراوانی سند، شباهت کسینوسی عبارات با زیرنویس، و ترکیب روش فراوانی کلمه-معکوس فراوانی سند و شباهت کسینوسی با زیرنویس رتبه بندی می شوند. در هر روش، برچسب های انتخابی برای تصویر، عبارات اسمی با رتبه بالاتر در آن روش است. روش های معرفی شده با استفاده از داده آزمایشی از پایگاه اطلاعات علمی ایران (گنج) که منبع اصلی اسناد علمی فارسی است، ارزیابی می شوند. طبق نتایج به دست آمده در این تحقیق روش فراوانی کلمه-معکوس فراوانی سند بهترین روش برای برچسب زدن تصاویرموجود در اسناد علمی است.
۲.

استخراج هوشمند مرز فراداده و متن در پایان نامه های فارسی با رویکرد BA_SVM(مقاله علمی وزارت علوم)

کلید واژه ها: استخراج فراداده استخراج اطلاعات ماشین بردار پشتیبان الگوریتم فرامکاشفهای الگوریتم خفاش

حوزه های تخصصی:
تعداد بازدید : ۲۰۳ تعداد دانلود : ۳۴۱
استخراج فراداده باعث تسهیل در فرایند نمایه سازی و بهبود در بازیابی اطلاعات است. از سوی دیگر، خودکارسازی این فرایند سبب افزایش کارایی نسبت به استخراج دستی فراداده هاست. نام دانشجو، نام اساتید، عنوان، رشته و مقطع تحصیلی، چکیده، و کلمات کلیدی نمونه ای از فراداده های پایان نامه است. هدف در این مقاله شناسایی خودکار مرز فراداده و بدنه اصلی در پایان نامه های فارسی است. بدین منظور، 250 پایان نامه ثبت شده در سامانه «ایرانداک» جمع آوری شده است. ویژگی های مد نظر از هر پاراگراف استخراج شده و سپس، پاراگراف های پایان نامه با روش ماشین بردار پشتیبان به دو کلاس فراداده و بدنه طبقه بندی شد. در این پژوهش برای تنظیم پارامترهای الگوریتم ماشین بردار پشتیبان، الگوریتم فرامکاشفه ای خفاش به کار گرفته شده است. نتایج نشان می دهد که روش پیشنهادی با دقت 6/96 درصد نوع پاراگراف را تشخیص می دهد.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان