استنتاج خودکار روابط بین اصطلاحات در اصطلاح نامه فارسی علوم اسلامی با استفاده از شبکه های پیچشی گرافی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
هدف: پژوهش حاضر درصدد ارائه مدلی برای استنتاج خودکار روابط بین اصطلاحات در اصطلاح نامه علوم اسلامی با استفاده از شبکه های پیچشی گرافی (GCN) بود، تا با استفاده از الگوریتم های جدید در حوزه یادگیری عمیق بتواند از اطلاعات موجود در اصطلاح نامه علوم اسلامی، سرعت، دقت و جامعیت را افزایش داده و موجب کاهش هزینه ها و در عین حال باعث بهبود روابط بین اصطلاحات شود. روش: پژوهش حاضر، از روش شبکه های پیچشی گرافی که یکی از مهم ترین روش های مطرح در حوزه یادگیری عمیق بوده و قادرند در کنار توجه به ویژگی های هر گره، از الگوهای روابط در گراف نیز سود بجویند، استفاده کرده است. دیتاست مورد مطالعه عبارت است از کلیه اصطلاحات اصطلاح نامه علوم اسلامی، که از سال 1372 تا ابتدای 1400 تولید شده، و به صورت یک گراف در نظر گرفته شده اند. اصطلاحات به عنوان رئوس و ارتباط بین اصطلاحات به عنوان یال های این گراف هستند و این گراف به عنوان ورودی، به شبکه پیچشی گرافی داده شده و مدلی برای استنتاج خودکار ارتباطات حاصل شده است. به منظور تجزیه و تحلیل خروجی های حاصل، از معیارهای AP و Roc استفاده شد. یافته ها: یافته های پژوهش نشان داد که میانگین دقت مدل بدست آمده برای داده های تست، 75 درصد و همچنین امتیاز Rocحاصل شده، برای داده های تست، 72 درصد می باشد، و با توجه به اینکه این روش در حوزه علوم اسلامی و اصطلاح نامه ها برای اولین بار مورد استفاده قرار، نتایج قابل قبول است. نتیجه گیری: علی رغم چرخش نظر از اصطلاح نامه ها به هستی شناسی ها، هنوز هم استفاده از اصطلاح نامه ها، مخصوصاً در کشور ایران مورد توجه است. در مقایسه با پژوهش های قبلی، روش استفاده شده برای ساخت اصطلاح نامه، متفاوت بوده و نتایج بدست آمده موجب اطمینان بیشتری است و در نتیجه در اهداف مختلف کاربرد اصطلاح نامه ازجمله نمایه سازی خودکار، خروجی های بهتری بدست آمده است. شیوه های جدید در پردازش زبان طبیعی و یادگیری عمیق نیز ما را در بازیابی اطلاعات و نمایه سازی خودکار امیدوارتر می کند.Automatic Inference of Terminology Relationships in the Persian Islamic Sciences Thesaurus using Graph Convolutional Networks (GCNs)
Purpose: The present research aims to develop a model for automatically inferring the relationships between terms in the Thesaurus of Islamic Sciences using Graph Convolutional Networks (GCN). By employing new algorithms in the field of deep learning, the research seeks to enhance the efficiency of information retrieval in the Thesaurus of Islamic Sciences. To enhance accuracy and comprehensiveness, reduce costs, and improve relationships between terms.
Method: The current research employed used of convolutional networks method, networks, is are one of the crucial techniques methods in the field of learning. This method is capable of leveraging from the relationship patterns in the while also focusing on to the characteristics of each node. The dataset under study comprises all the terms from the thesaurus of Islamic sciences generated between 1994 and the early 2022, which are represented as a graph. The vertices represent the terms, and the edges represent the relationships between the terms in the graph. This graph is provided as input to the convolutional network, which then generates a model for the automatic inference of connections. And in order to analyze the obtained outputs, AP and ROC standards have been used.
Findings: The revealed showed the model achieved the average accuracy 75% and a Roc score of 72% obtained for the data. It is noteworthy to accept the results considering that this method was used for the first time in the field of Islamic sciences and thesauruses.
Conclusion: Despite shift in preference opinion thesauri thesauruses to ontologies, the use thesauri remains still of particularly especially in Iran. Compared to previous research, the method used to construct the thesaurus is different, resulting in more reliable outcomes. Consequently, we can expect improved results for various purposes, such as automatic indexing. New advancements in natural language processing and deep learning also give us hope for improvements in information retrieval and automatic indexing.







