اشکان خطیر

نمایش ۱ تا ۵ مورد از کل ۵ مورد.

۱.

تحلیل همپوشانی عناصر واسط در بازنمایی اسناد متنی: مطالعه ای به روش الگوریتم «RAKE»(مقاله علمی وزارت علوم)

نویسنده: یعقوب نوروزی الهام یلوه اشکان خطیر

منبع: مطالعات کتابداری و سازماندهی اطلاعات دوره ۳۵ زمستان ۱۴۰۳ شماره ۴ (پیاپی ۱۴۰) 95 - 122

کلیدواژه‌ها: اسناد متنی استخراج کلیدواژه همپوشانی کلیدواژه بازنمایی اسناد پراکندگی داده ها

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۲۱ تعداد دانلود : ۲۵

هدف: پژوهش حاضر با هدف بررسی میزان همپوشانی کلیدواژه های استخراج شده از عناصر واسط در بازنمایی اسناد متنی با استفاده از الگوریتم «Rake» انجام شد.روش: در این پژوهش، با استفاده از الگوریتم «Rake» کلیدواژه های مجموعه داده ای شامل 500 مقاله علمی در پنج گروه موضوعی مختلف استخراج شد. سپس همپوشانی بین کلیدواژه های عنوان، چکیده و کلیدواژه های نویسندگان موردبررسی قرار گرفت.یافته ها: نتایج نشان داد که همپوشانی بین کلیدواژه های عنوان و کلیدواژه های نویسندگان حدود 45 درصد و همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان حدود 18 درصد بود. در ادامه مشاهده شد که کلیدواژه های عنوان دارای پوشش 22 درصدی کلیدواژه های چکیده بودند. نتایج همچنین نشان داد که همپوشانی و پراکندگی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان و نیز بین کلیدواژه های چکیده و کلیدواژه های عنوان به طور متوازن و تقریباً یکسان بود؛ اما مشاهده شد که کلیدواژه های عنوان و کلیدواژه های نویسندگان دارای پراکندگی بیشتری بودند؛ که نشان دهنده احتمال همپوشانی بیشتر بین کلیدواژه های عنوان و کلیدواژه های نویسنده یک مقاله در مقایسه با کلیدواژه های چکیده و کلیدواژه های نویسنده و همچنین کلیدواژه های چکیده و کلیدواژه های عنوان است. بعلاوه درک خوبی از مفاهیم و مباحث حوزه پژوهشی در رشته های روانشناسی و مدیریت دولتی وجود داشت، درحالی که در رشته های فناوری اطلاعات و حقوق عمومی نیاز به بهبود و تقویت درک مفاهیم مشاهده شد. میزان همپوشانی بین کلیدواژه های چکیده و کلیدواژه های نویسندگان در پنج گروه موضوعی حدود 20 درصد بود.نتیجه گیری: استفاده مناسب از کلیدواژه ها، نوشتن چکیده هایی با محتوای هماهنگ با موضوع موردنظر و انتخاب عناوین متناسب می تواند به بهبود فرایند استخراج مفاهیم، ذخیره سازی و بازیابی مقالات علمی کمک کند، ازجمله اینکه کلیدواژه ها، چکیده ها و عناوین می توانند به عنوان ورودی برای الگوریتم های استخراج مفاهیم، همچنین به عنوان بخش هایی از ساختار ذخیره سازی اطلاعات در سرعت دسترسی کاربران به اطلاعات موردنیازشان و به عنوان ورودی برای الگوریتم های بازیابی اطلاعات برای دسترسی سریع به مقالات مرتبط کمک بسزایی داشته باشند.

۲.

بهینه سازی سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی(مقاله علمی وزارت علوم)

نویسنده: الهام یلوه یعقوب نوروزی اشکان خطیر

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۸ بهار ۱۴۰۲ شماره ۳ (پیاپی ۱۱۳) 981 - 1010

تعداد بازدید : ۲۵۵ تعداد دانلود : ۱۵۸

پژوهش حاضر با هدف ارائه روشی برای سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی انجام شد. مجموعه داده های مربوط به پایان نامه ها و رساله ها شامل 2943 تحقیق به عنوان جامعه آماری در نظر گرفته شد. جمع آوری داده ها از مجموعه داده های مربوط به تحقیقات علمی که شامل 5000 پژوهش در قالب فایل اکسل بود، انجام شد. در این پژوهش پس از تبدیل داده ه ا به قالب ساخت یافت ه، با استفاده از اعمال پیش پردازش عملیات پردازش صورت گرفت. در مرحله پردازش از تکنیک خوشه بندی جهت ارائه الگوریتم پیشنهادی در راستای سازماندهی اسناد متنی فارسی بهره گرفته شد. این الگوریتم با بهبود الگوریتم K-means در جهت خوشه بندی اسناد ارائه شد. نتایج حاصل از ارزیابی نشان داد الگوریتم پیشنهادی بر اساس معیارهای خارجی نسبت به دو الگوریتم K-means و K-means++ در کیفیت خوشه بندی اسناد تأثیر مثبتی داشت. به طوری که تحقیقات هر رده تعیین شده در خوشه موضوعی مرتبط دارای توزیع یکنواختی شد، و منجر به حصول هدف پژوهش حاضر گردید. در جداول رده/ خوشه حاصل از دو الگوریتم K-means و K-means++ توزیع غیریکنواخت تحقیقات در خوشه ها مشاهده شد. بنابراین، ارزیابی بر اساس معیار های داخلی متأثر از تراکم متفاوت خوشه ها و شباهت بین خوشه ای بود. حجم دیتاست نیز متأثر از راهکارهای پیشنهادی برای انتخاب دیتاست نهایی و فرایند پژوهش نبود، بنابراین الگوریتم پیشنهادی برای ابعاد بالای ویژگی نیز مناسب عمل می کند.

۳.

مروری نظام مند بر پژوهش های بهبود الگوریتم کا-میانه برای خوشه بندی داده ها(مقاله علمی وزارت علوم)

نویسنده: الهام یلوه یعقوب نوروزی اشکان خطیر

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۷ زمستان ۱۴۰۰ شماره ۲ (پیاپی ۱۰۸) ۵۵۶-۵۲۷

کلیدواژه‌ها: خوشه بندی داده بهبود الگوریتم کا-میانه خوشه بندی مرور نظام مند

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۲۷۳ تعداد دانلود : ۲۱۶

خوشه بندی به عنوان یک فرایند جهت شناخت ماهیت و ساختار داده ها در بسیاری از حوزه های علوم و فناوری های مرتبط با آن نقش مهمی در سازماندهی داده ها دارد. یکی از الگوریتم های پرکاربرد و ساده خوشه بندی، کا-میانه است. پژوهش حاضر با هدف مرور نظام مند تحقیقات در زمینه بهبود الگوریتم کا-میانه برای خوشه بندی داده ها صورت گرفته است. این پژوهش با یک راهبرد جدید بر مبنای کاستی های الگوریتم کا-میانه به بررسی تحقیقات انجام شده در این زمینه و نقش آن در سازماندهی داده ها در محدوده سال های ۲۰۱۰ تا ۲۰۲۰ می پردازد. برای این منظور میزان توجه پژوهشگران به رفع هر یک از کاستی های این الگوریتم برای بهبود طی سال های مزبور در قالب پرسش های پژوهش تدوین شده است. در این پژوهش با استفاده از استراتژی جست وجو، پالایش، و استخراج مقاله ها در نهایت، ۴۷ منبع مرتبط شناسایی و مورد بررسی قرار گرفت. یافته ها نشان داد که بیشترین تحقیقات صورت گرفته با غلبه بر کاستی حساس به مراکز خوشه اولیه در جهت بهبود الگوریتم کا-میانه انجام شده است. همچنین، از ۴۷ تحقیق مورد بررسی، الگوریتم بهبودیافته کا-میانه در ۳۵ تحقیق بر روی داده های غیرمتنی و در ۱۲ تحقیق بر روی داده های متنی اعمال شده است. سرانجام، نتیجه حاصل از بررسی ۶ تحقیق از تحقیقات صورت گرفته نشان داد که حجم داده ها رابطه ای مستقیم با عملکرد الگوریتم بهبودیافته کا-میانه دارد. به عبارت دیگر، این الگوریتم باید به نوعی اصلاح شود که با اعمال بر روی حجم متفاوت داده ها خوشه بندی کارآمد و دقیقی انجام دهد.

۴.

تحلیل توزیع و تمرکز کلیدواژه های پارساها: میزان تطابق با توصیفگرها، عنوان، و چکیده(مقاله علمی وزارت علوم)

نویسنده: اشکان خطیر سهیل گنجه فر

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۴ پاییز ۱۳۹۷ شماره ۱ (پیاپی ۹۵) 411-428

کلیدواژه‌ها: نمایه سازی کلیدواژه توصیفگر توزیع کلیدواژه تمرکز فعالیت پژوهشی

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۶۱۶ تعداد دانلود : ۴۵۴

نمایه ها و چکیده های یک متن، خلاصه ای از متن را در اختیار خواننده قرار می دهند، لذا می توان از آن ها برای درک سریع و بازیابی سند استفاده کرد. ازآنجاکه بخش عمده ای از فعالیت های علمی فارسی در کشور ایران را پارسا ها تشکیل می دهند، در این پژوهش نمایه سازی پارسا ها از دو دیدگاه نویسنده پارسا و نمایه ساز حرفه ای موردبررسی قرار خواهد گرفت. سپس این نمایه ها با عنوان پارساها موردبررسی قرار می گیرد تا میزان انطباق با کلیدواژه های عنوانی به دست آید. از سوی دیگر با بررسی کلی مجموعه ای از نمایه ها و چکیده ها علاوه بر قابلیت بهبود در بازیابی اطلاعات برای محقق حوزه فعالیتی که بیشتر اسناد بر روی آن تمرکز کرده اند مشخص می شود.علاوه بر آن در این پژوهش وجود نمایه ها و توزیع آن ها در چکیده، بررسی می شوند. از توزیع کلیدواژه ها در چکیده می توان در استخراج خودکار کلیدواژه ها از چکیده پارساها در کارهای آتی استفاده شود. این پژوهش بر روی پارسا های موجود در پایگاه داده پژوهشگاه علوم و فناوری اطلاعات ایران که منبع گردآوری پارسا های فارسی است انجام شده است. روش پژوهش به این صورت است که بعد از گرداوری داده ها، پارسا هایی که اطلاعات کافی ندارند پالایه شده و مابقی پارسا ها توسط برنامه ای که برای پردازش متن چکیده و نمایه های پارسا ها نوشته ایم مورد تحلیل قرار خواهند گرفت. سپس اطلاعات بدست آمده با استفاده از آمار توصیفی شرح داده خواهند شد. بررسی انجام شده در این پژوهش نشان داده است عموماً نمایه های انتخاب شده (بیش از 60%) توسط نویسنده و نمایه ساز حرفه ای از 40% ابتدایی چکیده انتخاب شده اند. دیگر تحلیل های آماری این پژوهش نشان می دهند که میزان انطباق بین توصیفگرها و کلیدواژه ها 8% است. این اختلاف نشان دهنده میزان تفاوت نظر زیاد بین نویسندگان پارسا ها و نمایه سازان است. با بهره گیری از این اختلاف و با تجمیع کلمات و غنی کردن کلیدواژه های سیستم بازیابی اطلاعات می توان در بهبود بازیابی اطلاعات نیز استفاده کرد.

۵.

بررسی میزان تطابق زبان نمایه سازان، نویسندگان و برچسب گذاران در پایگاه اطلاعاتی اریک و مندلی(مقاله علمی وزارت علوم)

نویسنده: مریم قنواتی علیرضا نوروزی مریم ناخدا اشکان خطیر

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۳ تابستان ۱۳۹۷ شماره ۴ (پیاپی ۹۴) 1745-1766

کلیدواژه‌ها: نمایه سازی برچسب گذاری بازنمایی اطلاعات سازماندهی اجتماعی اطلاعات کلیدواژه های نویسنده اریک مندلی

حوزه‌های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

تعداد بازدید : ۶۳۳ تعداد دانلود : ۴۴۰

هدف این پژوهش شناسایی میزان تطابق زبان نمایه سازان، نویسندگان و برچسب گذاران در پایگاه اطلاعاتی اریک و مندلی است. این پژوهش از نوع کاربردی است که برای انجام آن از روش تحلیل محتوا استفاده شده است. جامعه مورد مطالعه در این پژوهش شامل 499 مقاله از 20 مجله حوزه علوم تربیتی است که در سال 2014 در پایگاه اطلاعاتی اریک نمایه سازی شده بودند. برچسب های تخصیص داده شده در فاصله زمانی از اول ژانویه سال 2014 تا سوم اوت سال 2016 از وبگاه مندلی استخراج گردید. کلیدواژه های تخصیص داده شده به مقاله ها توسط نویسندگان شان، از خود مقاله ها استخراج گردید. داده های گردآوری شده برای بررسی میزان تطابق این سه زبان با استفاده از برنامه ای به زبان برنامه نویسی شیء گرا سی شارپ مورد تجزیه و تحلیل قرار گرفت. همچنین به منظور مشخص شدن میانگین ها و فراوانی ها از آمار توصیفی استفاده شد و برای تحلیل و ارزیابی داده ها نرم افزار اکسل 2013 به کار گرفته شد. یافته ها نشان می دهد که میزان تطابق کلیدواژه های تخصیص داده شده توسط نویسندگان مدارک با برچسب های تخصیص داده شده توسط برچسب گذاران به همان مدارک در وبگاه مندلی 15درصد، میزان تطابق توصیفگرهای تخصیص داده شده توسط نمایه سازان به مدارک در پایگاه اریک با برچسب های تخصیص داده شده توسط برچسب گذاران به همان مدارک در وبگاه مندلی 3 درصد، میزان تطابق توصیفگرهای تخصیص داده شده توسط نمایه سازان به مدارک در پایگاه اریک با کلیدواژه های تخصیص داده شده توسط نویسندگان به همان مدارک 4 درصد، و در نهایت، میزان تطابق هرسه زبان مورد مطالعه 1/1 درصد بود. همچنین میزان حضور توصیفگرهای تخصیص داده شده توسط نمایه سازان در اصطلاحنامه اریک 34 درصد بود که از دو گروه نویسنده و برچسب گذار بیشتر است. یافته ها نشان داد که تطابق بیشتری بین واژگان و زبان نویسنده و برچسب گذار نسبت به تطابق بین واژگان و زبان نمایه ساز و برچسب گذار و همچنین تطابق بین واژگان و زبان نویسنده و نمایه ساز وجود دارد . نتایج این پژوهش نشان داد که برچسب گذاران واژه هایی متفاوت از توصیفگر های نمایه سازان و کلیدواژه های نویسندگان استفاده کرده اند، و این نشان دهنده عدم آشنایی سه گروه «نمایه ساز، نویسنده و برچسب گذار» از زبان و واژگان مورد استفاده همدیگر است. پیشنهاد می شود که به منظور جستجوی سودمند و بازیابی اطلاعات در نظام های سنتی نمایه سازی در هنگام کنترل واژه ها و همارایی واژه ها (پیش همارا و پس همارا) زبان کاربر و نویسنده مورد توجه قرار گیرد.

اشکان خطیر

مطالب
ترتیب بر اساس: جدیدترین پربازدیدترین

تحلیل همپوشانی عناصر واسط در بازنمایی اسناد متنی: مطالعه ای به روش الگوریتم «RAKE»(مقاله علمی وزارت علوم)

بهینه سازی سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی(مقاله علمی وزارت علوم)

مروری نظام مند بر پژوهش های بهبود الگوریتم کا-میانه برای خوشه بندی داده ها(مقاله علمی وزارت علوم)

تحلیل توزیع و تمرکز کلیدواژه های پارساها: میزان تطابق با توصیفگرها، عنوان، و چکیده(مقاله علمی وزارت علوم)

بررسی میزان تطابق زبان نمایه سازان، نویسندگان و برچسب گذاران در پایگاه اطلاعاتی اریک و مندلی(مقاله علمی وزارت علوم)

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

اشکان خطیر

مطالب ترتیب بر اساس: جدیدترینپربازدیدترین

تحلیل همپوشانی عناصر واسط در بازنمایی اسناد متنی: مطالعه ای به روش الگوریتم «RAKE»(مقاله علمی وزارت علوم)

بهینه سازی سازماندهی اسناد متنی فارسی با استفاده از تکنیک خوشه بندی(مقاله علمی وزارت علوم)

مروری نظام مند بر پژوهش های بهبود الگوریتم کا-میانه برای خوشه بندی داده ها(مقاله علمی وزارت علوم)

تحلیل توزیع و تمرکز کلیدواژه های پارساها: میزان تطابق با توصیفگرها، عنوان، و چکیده(مقاله علمی وزارت علوم)

بررسی میزان تطابق زبان نمایه سازان، نویسندگان و برچسب گذاران در پایگاه اطلاعاتی اریک و مندلی(مقاله علمی وزارت علوم)

کلیدواژه‌های مرتبط

پدیدآورندگان همکار

تبلیغات

پالایش نتایج جستجو

مطالب
ترتیب بر اساس: جدیدترین پربازدیدترین