مطالب مرتبط با کلیدواژه

مقاله های علمی


۱.

استخراج فراداده های متنی از مقاله های علمی به زبان فارسی با مدل آماری CRF(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استخراج فراداده های متنی مقاله های علمی پردازش زبان فارسی الگوریتم CRF

حوزه های تخصصی:
تعداد بازدید : ۹۲۱ تعداد دانلود : ۲۸۷
مقدمه: استخراج فراداده های متنی از مقاله های علمی به شکل دستی کار زمان بر و پرهزینه ای است. وجود تنوع در قالب های ساختاری مقالات علمی نیز به پیچیدگی مسئله می افزاید. بنابراین، استخراج خودکار فراداده های متنی از مقاله های علمی به عنوان یک مسئله مطرح است و از الگوریتم های مختلفی می توان برای استخراج فراداده ها استفاده کرد. هدف این مقاله ارائه ی یک چارچوب برای استخراج فراداده های متنی از مقاله های علمی به زبان فارسی است. در این پژوهش از مدل آماری سی آر اف برای استخراج فراداده ها استفاده شده است. روش شناسی: این مقاله یک پژوهش کاربردی است. در این مقاله با مطالعات کتابخانه ای و آزمایش سعی شده است یک چارچوب برای استخراج فراداده ها ارائه شود. چارچوب ارائه شده شامل شناسایی سرآیند و مراجع انگلیسی و فارسی مقاله است. از مدل آماری سی آر اِف برای استخراج فراداده ها از سرآیند و مراجع فارسی و انگلیسی استفاده شده است. با تعریف ویژگی های مختلف این مدل آماری قابل تغییر است. آزمایش این روش بروی صد مقاله از مجلات علمی- پژوهشی ایران درصد موفقیت آن را نشان می دهد. مدل آماری سی آر اِف در برچسب زنی متن نسبت به مدل های آماری دیگر مانند مدل مخفی مارکوف دقت بالاتری را ارائه می دهد. از سوی دیگر این مدل بر مبنای آمار و ریاضی برچسب زنی را انجام می دهد. استخراج فراداده ها از مقالات با قالب های مختلف به کمک آمار نسبت به روش های مبتنی بر قانون نتایج بهتری را به دنبال دارد. بنابراین استفاده از مدل آماری سی آر اِف برای حل این مسئله مناسب است. یافته ها: برای ارزیابی روش پیشنهاد شده از معیار اِف استفاده شده است. مقدار معیار اِف در این پژوهش برای هر توکن متنی محاسبه شده است. مقدار معیار اِف به شکل میانگین برای فراداده های سرآیند، فراداده های مراجع فارسی و فراداده های مراجع انگلیسی به ترتیب ۸۹/۹۶ درصد، ۸۷/۹۳ درصد و ۷۵/۹۴ درصد است. نتایج این پژوهش با سه پژوهش مشابه در زبان انگلیسی مقایسه شده است. مقایسه میانگین نتایج به دست آمده نشان می دهد در فراداده های سرآیند نتایج پژوهش این مقاله بهتر از دو پژوهش انجام شده در زبان انگلیسی است. نتایج استخراج فراداده نویسنده در سرآیند در پژوهش های زبان انگلیسی بهتر است. برای فراداده چکیده در پژوهش زبان فارسی، نتایج بهتری به دست آمده است. مقایسه میانگین نتایج استخراج فراداده های مراجع، نشان می دهد پژوهش های زبان انگلیسی دقت بالاتری ارائه داده اند. نتایج استخراج فراداده مؤسسه در مراجع فارسی نسبت به فراداده های دیگر ضعیف تر است. بحث و نتیجه گیری: بررسی نتایج بدست آمده نشان می دهد که عملکرد مدل آماری سی آر اِف برای استخراج فراداده ها خوب است. بیشترین دقت برای فراداده چکیده با معیار اِف برابر ۶/۹۹ درصد است. این فراداده تعداد توکن بسیار بیشتری نسبت به بقیه فراداده ها دارد. دقت فراداده مؤسسه با معیار اِف برابر ۹۵/۸۰ درصد کمتر از بقیه است. دو دلیل در کاهش دقت موثر است. تعداد این فراداده در پیکره متون نسبت به فراداده های دیگر کمتر است. علاوه بر این کلمات نحوی که در این فراداده به کار می رود، تنوع بیشتری دارد. در مراجع فارسی اسامی شهرها در فراداده های مکان و مؤسسه به کار می رود. این مسئله باعث می شود در برخی از موارد فراداده های مکان و مؤسسه به اشتباه تشخیص داده شوند. در زبان فارسی کلماتی که به شکل مشترک در فراداده های مختلف به کار می روند نسبت به زبان انگلیسی بیشتر است. برای مثال بسیاری از اسامی ایرانی که برای نام افراد به کار می رود با معانی دیگر در فراداده های دیگر استفاده می شود. این مسئله ممکن است باعث بروز خطا شود. اکثر خطاهای به وجود آمده در استخراج فراداده ها مربوط به توکن هایی است که در مرز دو فراداده قرار دارند. تبدیل مقالات علمی فارسی با فرمت پی دی اِف به فرمت متن در موارد زیادی با مشکل رو به رو است و از محدودیت های این پژوهش به شمار می آید. در این پژوهش مجموعه ای از صد مقاله علمی استفاده شد. افزایش تعداد مقاله های علمی و تنوع بیشتر مقالات برای آزمایش می تواند در نتیجه ی بدست آمده تاثیر مثبتی داشته باشد. مجموعه ای از ویژگی های متنی در الگوریتم های برچسب زنی سی آر اِف استفاده می شود. تغییر در این ویژگی ها می تواند موجب بهینه سازی روش شود.
۲.

بررسی انتقادی مقاله های علمی درباره مینی مالیسم در حکایت ها(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بررسی انتقادی حکایت داستان مینیمالیستی مقاله های علمی

حوزه های تخصصی:
تعداد بازدید : ۴۳۲ تعداد دانلود : ۴۳۹
موضوع این مقاله، بررسی انتقادی سی مقاله نوشته شده درباره شباهت های حکایت ها با داستان های مینی مالیستی است. بدین منظور، مقاله های مورد بحث در دو زمینه رعایت اخلاق و اصول پژوهش های علمی، و دقت و صحت تحلیل ها و یافته ها، به روش توصیفی تحلیلی بررسی شده اند. نتایج این بررسی نشان می دهد اِشکال مقاله ها از نظر رعایت اخلاق و اصول پژوهش های علمی عبارت اند از: سرقت از خود، ساختار قالبی مقالات، عناوین تکراری و شبیه به هم، بی توجهی به پیشینه پژوهش و نقص در ساختار منطقی قسمت های مختلف مقالات و نیز رعایت نکردن امانت داری یعنی گرته برداری و نقل قول از منابع بدون ارجاع به منبع اصلی یا واسطه، نقل نادرست یا تغییر گفته های منابع پیشین. همچنین پرداختن به متن های غیرداستانی، حاشیه روی و ذکر موضوعات غیرضروری و نامربوط، آوردن شواهد و تحلیل های نادرست، دقت نکردن در صحت گزاره ها و درنهایت فقدان یافته های جدید، بدیع و صحیح، مهم ترین مواردی است که نشان می دهد تمام مقاله های مورد بررسی فاقد دقت و صحت شایسته پژوهش های علمی هستند. با توجه به اینکه هدف همه مقاله ها اثبات این همانی دو نوع ادبی است، نوشته شدن این تعداد مقاله در موضوع مورد بحث، ضرورتی ندارد و به علاوه پرداختن به موضوع حتی در یک مقاله، نه تنها کمکی به درک بهتر این دو نوع ادبی نمی کند، بلکه به دلیل مخدوش کردن احکام و قواعد نهادی دو نوع ادبی، مشکلاتی را پیشِ روی مخاطبان و پژوهشگران قرار می دهد.
۳.

بررسی میزان مطابقت بازیابی محتوا با تصاویرها و چالش های آن در مقاله های پایگاه های اطلاعاتی علمی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی تصویر بازیابی محتوا مقاله های علمی چالش های بازیابی تصویر پایگاه اطلاعات علمی

حوزه های تخصصی:
تعداد بازدید : ۴۵۰ تعداد دانلود : ۳۰۵
هدف از این تحقیق بررسی میزان و چالش های مطابقت بازیابی محتوا با تصویرها در مقاله ها پایگاه های اطلاعاتی علمی می باشد. روش پیمایشی توصیفی بوده و جامعه آماری تحقیق حاضر پایگاه های اطلاعاتی علمی ساینس دایرکت، اسکوپوس، مدلاین و وب آو ساینس هست. ابتدا، عنوان، چکیده، بیان مسأله و نتیجه گیری مقاله ها به صورت جداگانه وارد نرم افزار Etreme picture finder شد. سپس تصویرها مرتبط با عنوان، چکیده، بیان مسئله و نتیجه گیری مقاله ها از نرم افزار موردنظر استخراج گردید. تصویرها استخراج شده وارد نرم افزار visual similarity duplicate image finder گردید. نتایج مطابقت تصویرهای استخراج شده از نرم افزار و تصویرهای مقاله ها انجام شد . نتایج نشان داد که بیشترین میزان مطابقت محتوا با تصویر در پایگاه وب آو ساینس و کمترین میزان مطابقت در پایگاه ساینس دایرکت وجود داشت. همچنین به ترتیب بیشترین شباهت بین عنوان ها، بیان مساله، چکیده و نتیجه گیری با تصویرهای مقاله ها در پایگاه ها وجود داشت. عدم رعایت استانداردهای مصور سازی در تصویرهای بکارگرفته شده در مقاله های پایگاه های علمی چالش جدی است. که ازاستاندارهای مصور سازی (متن، رنگ، لبه، حاشیه و ....) به دور بودند بازیابی نشدند و در صورت بازیابی از میزان شباهت نازلی برخوردار بودند. عدم جامعیت قابلیت های نرم افزار ها مورد استفاده، چالش بعدی بود. مسأله دیگر عدم رعایت یا پیروی از یک شیوه نامه استاندارد در چیدمان تصویرها در مقاله ها می باشد. برخی تصویرها بدون توجه به متن در مقاله ها درج شده است.این مورد در پایگاه وب آو ساینس کمتر اما در سایر پایگاه های مورد بررسی به کثرت مشاهده گردید. با توجه به ابداع روش های جدید بازیابی تصویر و محتوا، نتیجه این بررسی نشان میدهد عدم شباهت بین تصویرهای بازیابی شده با محتوا در مقالات پایگاه های معتبر علمی چشمگیر و گمراه کننده می باشد.
۴.

فراتحلیل کیفی مقاله های علمی مرتبط با بهره وری اعضای هیئت علمی در ایران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: فراتحلیل بهره وری اعضای هیئت علمی مقاله های علمی

حوزه های تخصصی:
تعداد بازدید : ۲۷ تعداد دانلود : ۲۵
هدف: هدف از اجرای این پژوهش، فراتحلیل مقاله های با موضوع بهره وری اعضای هیئت علمی، به منظور جمع بندی از وضعیت آخرین دستاوردهای علمی انجام گرفته در این خصوص، شناسایی نقاط قوت و ضعف مقاله های این حوزه و ارائه راهکارهای پیشنهادی به منظور بهبود پژوهش های آینده در این زمینه است. روش پژوهش: روش تحقیق حاضر، فراتحلیل کیفی است. در این روش 54 مقاله علمی مرتبط با بهره وری اعضای هیئت علمی در دو دهه اخیر، سال های 1380 تا 1400، از منابع علمی «پایگاه مجلات تخصصی نور»، «پرتال جامع علوم انسانی»، «بانک اطلاعات علمی جهاد دانشگاهی» و «بانک اطلاعات نشریات کشور» شناسایی و استخراج شد. با مطالعه و بررسی این مقاله ها تعداد 40 مورد از مرتبط ترین آنها برای انجام فراتحلیل انتخاب شدند. یافته ها: یافته ها نشان می دهد که در این مقاله ها غالباً به عوامل فردی و درون سازمانی مؤثر بر بهره وری اعضای هیئت علمی توجه شده است. رویکرد روش شناختی غالب در این مقاله ها روش کمی است. اغلب مقاله ها بدون رویکرد نظری قوی و توصیه های سیاستی بوده و رویکرد غالب در توصیه های سیاستی، رویکرد کلان و مدیریتی است. مقاله های بررسی شده از حیث شاخص هایی مانند پرسش ها، هدف ها و فرضیه ها وضعیت نسبتاً خوبی داشتند؛ اما بخش نتیجه گیری در بیشتر مقاله ها دارای نظم و انسجام کافی و راهکارهای عملیاتی نبود. نتیجه گیری: با اجرای این پژوهش مشخص شد که وضعیت پژوهش های علمی داخلی در زمینه بهره وری اعضای هیئت علمی به لحاظ شاخص های نه گانه، وضعیت نسبتاً مطلوبی نیست. تعداد پژوهش های کیفی و عمیق در این زمینه بسیار اندک بوده و تقریباً هیچ کدام از آنها دارای مبانی نظری و راهکارهای اجرایی نبوده و در عمل کاربرد ندارند. از طرفی موضوع بهره وری اعضای هیئت علمی یکی از موضوعات کلیدی و مهم در نظام آموزش عالی است که مستلزم برنامه ریزی برای بهبود تحقیقات آتی در این زمینه است.