آرشیو

آرشیو شماره‌ها:
۵۵

چکیده

شناسایی و دسته بندی موضوعی اشعار دیوان حافظ همواره مورد توجه حافظ پژوهان بوده و مطالعات گوناگونی دراین باره انجام گرفته است. عمده این پژوهش ها، اشعار را براساس تقسیم بندی تاریخی یا دوره زندگی شاعر دسته بندی کرده اند یا از نظرات کارشناسان و خبرگان حوزه ادبیات فارسی بهره برده اند. این پژوهش با شناسایی موضوعات اشعار دیوان حافظ براساس هوش مصنوعی و متن کاوی صورت گرفته و نظرات کارشناسان در آن دخالتی نداشته است. در این مطالعه، پس از بیان ویژگی های ظاهری و انجام پیش پردازش های لازم روی اشعار، هشت موضوع اصلی در دیوان حافظ شناسایی شده است. سپس، باتکیه بر واژگان پرکاربرد هر موضوع و استفاده از هوش مصنوعی، این موضوعات نام گذاری شده اند. موضوعات استخراج شده شامل «سوز و گداز»، «مدح و ستایش»، «فراق و وصال»، «زیبایی و دلربایی»، «عیش و مستی»، «راز عشق»، «طریقت و عرفان» و «رندی و آزادگی» است. در ادامه، اشعار حافظ براساس این موضوعات دسته بندی شده اند و میزان ارتباط هر شعر با هر موضوع، برپایه بیشترین ارتباط و یا برخورداری از حدآستانه ارتباط، استخراج شده است. روش به کارگرفته شده در این پژوهش، مستقل از نظر خبرگان و کاملاً مبتنی بر یادگیری ماشین و هوش مصنوعی است. این رویکرد با واکاوی واژگان به بررسی و شناسایی موضوعات موجود در دیوان حافظ پرداخته است و قابلیت تعمیم به دیگر متون ادبی را نیز دارد.

Topic Identification and Classification of Hafez’s Poems Using Artificial Intelligence and Text Mining

Topic extraction and classification of Hafez's poetry have long been a focus of scholarly attention, with existing studies primarily adopting either historical periodization approaches or relying on expert interpretations from Persian literature specialists. This study presents a novel computational methodology for identifying and categorizing topics in Hafez's Divan using artificial intelligence and text mining techniques, completely independent of human expert judgment. Following text preprocessing and feature extraction, our analysis revealed eight principal topics within the Divan . These topics were automatically labeled based on their most characteristic vocabulary using AI assistance: 1) Anguish and Ardor, 2) Panegyric and Praise, 3) Separation and Reunion, 4) Beauty and Allure, 5) Revelry and Intoxication, 6) The Mystery of Love, 7) Mysticism and Spirituality, and 8) Bohemianism and Libertarianism. Each poem was systematically classified according to its strongest topic association, with threshold-based analysis employed to determine significant thematic connections. Our completely automated, machine learning-driven approach to lexical pattern analysis in Hafez’s work demonstrates a reproducible methodology applicable to other literary corpora.

تبلیغات