نیلوفر مظفری

نیلوفر مظفری

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۴ مورد از کل ۴ مورد.
۱.

ارائه روشی مبتنی بر تحلیل مراجع کتابشناختی برای شناسایی مقالات علمی مرتبط در کتابخانه های دیجیتال(مقاله علمی وزارت علوم)

نویسنده:

کلید واژه ها: تحلیل مراجع کتابشناختی بازیابی اطلاعات معیار شباهت دقت

حوزه های تخصصی:
تعداد بازدید : 874 تعداد دانلود : 648
حجم مستندات و مقالات علمی در دهه اخیر افزایش بسیار زیادی کرده است که این امر، شناسایی مقالات مرتبط در کتابخانه های دیجیتال را با چالش هایی روبرو کرده است. هدف این پژوهش، ارائه روشی مبتنی بر تحلیل مراجع کتابشناختی برای شناسایی مقالات علمی مرتبط در کتابخانه های دیجیتال است. جامعه آماری این پژوهش، مقالات منتشر شده در 5 سال اخیر در نشریات فارسی و انگلیسی نمایه شده در پایگاه استنادی علوم جهان اسلام در حوزه علوم کامپیوتر می باشد. روش پیشنهادی قادر است با تحلیل مراجع مقالات، مقالاتی را که بیشترین شباهت با مقاله داده شده دارند، پیدا کند و آنها را بر اساس میزان شباهتشان، مرتب نماید. در این راستا بعد از استخراج عنوان و بدست آوردن شباهت میان مراجع موجود میان مقالات، آن دسته از مقالاتی که بیشترین شباهت را با یک مقاله دارند، شناسایی شده و بر اساس میزان شباهتشان مرتب می شوند. به منظور مقایسه، روش پیشنهادی با روش های دیگر مقایسه شد که نتایج بدست آمده روی هم داده های فارسی و هم داده های انگلیسی نشاندهنده کارایی روش پیشنهادی در شناسایی مقالات مرتبط است.
۲.

تخمین تعداد موضوعات در مدلسازی موضوعی روی مقالات علمی فارسی(مقاله علمی وزارت علوم)

نویسنده:

کلید واژه ها: نظریه بازبهنجاری آنتروپی رونو جستجوی گریدی توزیع دیریکله

حوزه های تخصصی:
تعداد بازدید : 719 تعداد دانلود : 842
با افزایش داده ها در سال های اخیر که عمدتا غیرساخت یافته هستند، بدست آوردن اطلاعات دلخواه و مرتبط با پیچیدگی هایی همراه می شود. هوش مصنوعی با ارائه تکنیک هایی کمک می کند تا بتوان اطلاعات ارزشمندی را از داده ها استخراج کرد. یکی از تکنیک های قوی برای تحلیل مجموعه بزرگی از متون، مدلسازی موضوعی است که در واقع فرآیند تشخیص خودکار موضوعات در یک متن با هدف کشف الگوهای پنهان می باشد. بزرگترین چالش موجود در مدلسازی موضوعی، تشخیص تعداد موضوعات موجود می باشد که نتیجه نهایی به این پارامتر وابسته است. این پژوهش با مقایسه دو روش، یکی مبتنی بر گریدی و دیگری مبتنی بر نظریه بازبهنجاری، این پارامتر را برای مقالات نشریات فارسی تخمین زده است. روش گریدی با تعریف یک معیار برای ارزیابی مدل موضوعی و بدست آوردن این معیار با توجه به مقادیر مختلف تعداد موضوعات، می تواند تعداد موضوعات بهینه را تخمین بزند. الگوریتم دیگر مبتنی بر نظریه بازبهنجاری است که در واقع یک فرمولاسیون ریاضی برای ساخت یک رویه برای تغییر مقیاس سیستم تحت بررسی می باشد؛ به صورتی که رفتار سیستم حفظ شود و تغییری در روند آن ایجاد نشود. با استفاده از این نظریه و استفاده از اطلاعات مرحله قبل، می توان تعداد موضوعات را با سرعت تخمین زد. همچنین مدت زمان اجرای هر دو الگوریتم روی مقالات نشریات مختلف فارسی، ارائه و با یکدیگر مقایسه شده است. یافته ها نشان دهنده سرعت روش مبتنی بر نظریه بازبهنجاری در تخمین تعداد موضوعات موجود در مقالات نشریات فارسی است. به عنوان دستاورد دیگری از این پژوهش، لیستی از ایست واژه هایی که منحصرا مربوط به مقالات فارسی هستند، استخراج و ارائه گردید.
۳.

تأثیر کمبود و پراکندگی داده بر اثربخشی نتایج سامانه ژورنال یاب رایسست: مطالعه موردی حوزه فنی و مهندسی(مقاله علمی وزارت علوم)

کلید واژه ها: اثربخشی سامانه پیشنهاددهنده نشریه کمبود داده پراکندگی داده سامانه ژورنال یاب رایسست

حوزه های تخصصی:
تعداد بازدید : 94 تعداد دانلود : 912
عوامل متعددی از مجموعه عناصر تشکیل دهنده سامانه های پیشنهاددهنده در تولید و ارائه پیشنهاد دخیل هستند. مطالعه حاضر، با هدف شناخت تاثیر دو چالش کمبود و پراکندگی داده بر اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست انجام شده است. بدین منظور بیش از ۱۵۰۰۰ مقاله از نشریه های فنی و مهندسی در بازه زمانی ۱۳۹۲ تا ۱۳۹۶ از وب سایت نشریه ها گرداوری شد. در مرحله بعد عناصر متنی این مقاله ها شامل عنوان، چکیده و واژه های کلیدی استخراج، نرمال سازی و پردازش شد و پایگاه داده پیکره پژوهش ایجاد گردید. بر اساس تعداد مقاله های گردآوری شده، با استفاده از فرمول کوکران تعداد ۴۰۰ مقاله پایه که پیش از این در نشریه های مرتبط با موضوع منتشر شده بودند، به روش تصادفی- تناسبی، انتخاب شد. عنوان و چکیده این مقاله ها، به منظور دریافت نشریه های پیشنهادی سامانه، جهت چاپ مقاله در دو مرحله پیش و پس از بهبود دو چالش کمبود و پراکندگی داده به عنوان پرسمان وارد سامانه شد. سپس نتایج پیشنهادی در هر مرحله در قالب فایل اکسل ذخیره گردید. در نهایت میزان اثربخشی نتایج سامانه در هر مرحله، به روش اعتبارسنجی یک طرفه و بر اساس معیار دقت در k تعیین شد. فراوانی نسبی رده ها نشان داد در وضعیت موجود، نشریه هدف تنها در ۲۶ درصد از پرسمان ها در ۳ رتبه نخست پیشنهاد شده است. در راستای بهبود چالش کمبود داده با غنی سازی، نرمال سازی و پردازش داده ها اثربخشی نتایج در ۳ رتبه نخست به میزان ۱۵ درصد افزایش یافت. اما همچنان در بیش از ۳۰ درصد پرسمان ها، نشریه هدف در رتبه ۱۰ و بالاتر پیشنهاد شده بود. بنابراین در مرحله بعد به منظور بهبود چالش پراکندگی، دسته بندی موضوعی داده ها انجام و افزایش ۳۰ درصدی اثربخشی نتایج نسبت به مرحله پیشین در ۳ رتبه نخست حاصل گردید. بر این اساس یکی از عواملی که منجر به کاهش اثربخشی نتایج پیشنهادی سامانه ژورنال یاب رایسست می گردد، کمبود و پراکندگی داده ها است؛ که با غنی سازی پایگاه داده، بهبود فرآیند پردازش و دسته بندی موضوعی داده ها می توان به میزان قابل توجهی با این دو چالش مقابله و اثربخشی نتایج پیشنهادی سامانه را بهبود بخشید.
۴.

ارائه روشی مبتنی بر ژنتیک برای رفع ابهام نام نویسندگان مقالات(مقاله علمی وزارت علوم)

نویسنده:

کلید واژه ها: ابهام نام نویسندگان فاصله لونشتین الگوریتم ژنتیک تابع برازش

حوزه های تخصصی:
تعداد بازدید : 861 تعداد دانلود : 536
امروزه با افزایش روزافزون حجم مقالات از یک طرف و استفاده از اینترنت و خدمات موتورهای جستجو از طرف دیگر، روش های ابهام زدایی از اسامی پژوهشگران بسیار مورد توجه قرار گرفته است. تاکنون روش های مختلفی برای حل این مشکل ارائه شده که هر کدام مزایا و معایب خاص خود را دارند. هدف این مقاله، ارائه راهکاری جهت شناسایی رکوردهای متعددی است که به یک نویسنده تعلق دارند. بدین منظور بعد از استخراج ویژگی های داخلی و خارجی نویسندگان، یک معیار جدید جهت مشخص کردن میزان مشابهت میان دو رکورد ارائه شده است. اهمیت هر کدام از ویژگی های ارائه شده، با استفاده از الگوریتمی مبتنی بر ژنتیک با دو تابع برازش مختلف تعیین می شود تا از طریق یادگیری نمونه های موجود، بهینه ترین ضرایب بدست آیند. روش پیشنهادی با دو تابع برازش روی داده های آزمایشی مورد ارزیابی و مقایسه قرار گرفته و نتایج حاصله نشاندهنده افزایش دقت در روش پیشنهادی با هر دو تابع برازش نسبت به روش قبلی است.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان