طراحی سامانه نیمه خودکار ساخت هستی شناسی به کمک تحلیل هم رخدادی واژگان و روش C-value ( مطالعه موردی: حوزه علم سنجی ایران)(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هستی شناسی ها ابزار بیان رسمی مفاهیم و روابط موجود در قلمرویی خاص هستند. در سال های اخیر تلاش های زیادی برای طراحی روش های یادگیری و خودکار سازی فرایند ساخت هستی شناسی انجام شده است. از آنجا که هستی شناسی را مجموعه مفاهیم و روابط آن می دانیم، استخراج مفاهیم و روابط معنایی میان این مفاهیم از اهمیت بسیاری برخودار است. ساخت انواع هستی شناسی برای انواع قلمروها و کاربردهای گوناگون، فرایندی پرهزینه و زمان بَر بوده و خودکارسازی این فرایند، گام مهمی در رفع آن است. عدم وجود دانش پایه مانند اصطلاح نامه ها یا پایگاه های دانش حوزه ها، اکتساب دانش برای ساخت هستی شناسی آن حوزه ها مشکل خواهد بود. در پژوهش حاضر روشی نیمه خودکاری برای اکتساب دانش در حوزه علم سنجی ایران ارائه شده که قادر است اطلاعات این حوزه را استخراج کرده و در فرایندی، دانش موجود را برای ساخت هستی شناسیِ آن پردازش کند. بدین منظور ابتدا اسناد مرتبط با حوزه ی مورد نظر گردآوری شده و به روش متن کاوی، نمایه سازی خودکار گردید. سپس در مرحله بعدی با استفاده از روش C-valueمفاهیم اصلی، استخراج شده است، آنگاه با استفاده از روش خوشه بندی k- means ، اسناد مربوطه، خوشه بندی شدند و برای هر خوشه با محاسبه وزن مفاهیم، براساس روش TF-IDF، مفاهیم کلیدی مناسب استخراج گردید. در پایان با استفاده از روش تحلیل هم رخدادی واژگان، سلسله مراتب مفاهیم حوزه، استخراج شده و هستی شناسی مربوطه ساخته شده است. نتایجِ به دست آمده، نشان می دهند که این روش در مقایسه با روش های مشابه دقت بسیاری در یادگیری ساخت هستی شناسی داشته است .