ملاک های برچسب گذاری استعاره: گامی به سوی ساخت پیکره ی استعاره (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
فهم معنای زبانِ انسان برای ماشین همواره با چالش هایی رو به رو است. استعاره نیز یکی از موضوع های دشوار در پردازش معنایی است. درک استعاره در ارتقا و توسعه فعالیت های حوزه پردازش زبان طبیعی اهمیت فراوانی دارد. مقاله حاضر به معرفی روشی برای شناسایی استعاره ها در زبان فارسی می پردازد. هدف این مقاله، پیشنهادِ شیوه نامه ای است که به کمک آن بتوان پیکره ای برای استعاره های فارسی تدوین کرد. برای انجام چنین کاری نیاز است که ملاک هایی برای شناسایی و برچسب گذاری استعاره معرفی شود. روال شناسایی استعاره ی دانشگاه آزاد آمستردام (ام.آی.پی.وی.یو) می تواند انواع استعاره را شناسایی کند و در ساخت پیکره استعاره نیز از آن می توان بهره برد. مبنای مقاله حاضر نیز همین روال شناسایی است. بهره گیری از این روال از دو جهت مفید است: نخست، به کمک این روال می توان پیکره ای از استعاره های فارسی تهیه کرد، دوم، به پژوهشگران حوزه استعاره، به ویژه زبان شناسان پیکره ای، کمک می کند که با روایی و پایایی مطلوبی استعاره های فارسی را تحلیل کنند. لازم به گفتن است که برای آزمودن کارآیی روال پیشنهادی، پیکره ای از داده های فارسی (متون خبری و دانشگاهی) گردآوری و توسط سه کارشناس برچسب گذاری شده و یافته های مطلوبی (ضریب کاپای ۰.۹۶۴) به دست آمده است که در پژوهشی جداگانه به آن خواهیم پرداخت.Metaphor Annotation Criteria: A Step towards Building a Metaphor Corpus
Due to the development of smart devices, the ability of computers to understand human language has become a key issue in technology. By learning and analyzing machine-readable, annotated linguistic data, computers are able to comprehend human language (corpus). Corpora plays a crucial role in helping computers comprehend human language. Metaphor is one of the most complicated linguistic data that computers cannot comprehend. Despite the prevalence of metaphor in everyday language use and the importance of identifying it, no corpus has been published for Persian yet. Compiling a corpus of Persian metaphors is the initial step in learning metaphors for computers.To compile a corpus of Persian metaphors, it is necessary to meet two main criteria. Deciding the best definition is the first prerequisite. The best definition is both comprehensive and applicable; comprehensive in the sense that it covers a significant proportion of metaphorical instances, and applicable in the sense that it could be used to build a corpus. The second requirement is the construction of a method for metaphor identification. Without a straightforward data annotation method, it is impossible to identify metaphors.