امکان سنجی توسعه هستی شناسی به روش نیمه خودکار مبتنی بر تحلیل بسامد واژگان: مطالعه موردی بیماری «گلوکوم»(مقاله علمی وزارت علوم)
حوزه های تخصصی:
تغییر رویکرد نظام های اطلاعاتی از پردازش واژه به پردازش مفهوم، موجب توجه به هستی شناسی ها شده است. در علوم پزشکی و بیماری های انسان، به لحاظ وجود تنوع در اصطلاحات و لزوم اشتراک اطلاعات از طریق نرم افزارهای مختلف مانند پرونده های پزشکی، سامانه های ثبت سوابق بهداشتی و... بکارگیری هستی شناسی ها ضروری به نظر می رسد. در پژوهش حاضر، رویکردی نیمه خودکار برای توسعه هستی شناسی پیشنهاد شده است که می تواند با استفاده از ابزارهای متن کاوی، شناسایی مولفه های ساختاری هستی شناسی و تعیین نسبی روابط را از متون علمی تسهیل کند. مدل پیشنهادی در قالب کد نرم افزاری با نام اختصاری «TmbOnt_Alfa[1]» ارائه شده است. این کد با استفاده از رابط کاربر، فایل متنی ورودی را فراخوانی کرده و پس از پردازش بر اساس تنظیمات، اصطلاحات کلیدی برای توسعه هستی شناسی را استخراج می کند. به منظور ارزیابی کارایی روش پیشنهادی، مطالعه موردی در حوزه بیماری «گلوکوم» با داده های متنی مشتمل بر10،000 چکیده مقاله از «PubMed[2]» برمبنای جستجوی واژگانی تهیه گردید. پس از مراحل پردازش، مفاهیم و ساختار سلسله مراتبی هستی شناسی حاصل در پروتژ وارد شد. سرانجام، سنجش قیاسی هستی شناسی توسعه یافته با سرعنوان پزشکی «MESH[3]»، «اصطلاح نامه وتوصیفگرهای پزشکی فارسی» و «هستی شناسی بیماری ها» و «هستی شناسی BAO[4]» نشان داد که میانگین دقت مفاهیم و میانگین دقت مکانی مفاهیم بیش از 70 درصد با هستی شناسی های بازنمایی شده در پایگاه های معتبر هستی شناسی بیماری های انسانی «Bio-Ontologies» انطباق داشته و به طور میانگین بیش از 30 درصد واژگان جدید برای افزودن به دامنه را فراهم کرده است. [1] Text miner for base ontology development, Alfa version[2] https://pubmed.ncbi.nlm.nih.gov/[3] https://www.ncbi.nlm.nih.gov/mesh/[4] https://bioportal.bioontology.org/ontologies/BAO