مطالب مرتبط با کلیدواژه

ساخت های فعل سبک


۱.

پیکره ساخت های فعل سبک زبان فارسی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: زبان فارسی منابع داده ای پیکره زبانی ساخت های فعل سبک پردازش زبان طبیعی

حوزه‌های تخصصی:
تعداد بازدید : ۲۱۸ تعداد دانلود : ۲۰۵
پیکره زبانی مجموعه ای بزرگ از داده های زبانی مبتنی بر کاربرد سخنوران زبان هاست که الگوهای واقعی کاربرد زبانی را در اختیار پژوهشگران قرار می دهند. برتری پیکره ها در مقایسه با سایر منابع داده ای علاوه بر حجم زیاد داده ، ایجاد امکان به کارگیری رایانه در بررسی های زبانی است. مقاله حاضر به معرفی اولین پیکره ساخت های فعل سبک زبان فارسی می پردازد. آشنایی با ماهیت این ساخت ها و دسترسی به فهرستی از آن ها، علاوه بر اهمیت نظری به لحاظ کاربردی نیزحائز اهمیت است. این یافته ها در حوزه بررسی های هوش مصنوعی مرتبط با پردازش زبان های طبیعی، ترجمه ماشینی، آموزش زبان فارسی، دستورنویسی و فرهنگ نگاری کاربرد می یابد. پیکره هدف این پژوهش «پیکره زبانی ساخت های فعل سبک زبان فارسی» یا  LCP نام دارد. برای ایجاد آن پیکره تک زبانه پژوهشگاه ارتباطات و فناوری اطلاعات (بی جن خان، 1397) که حاوی 950000 فایل متنی است، به عنوان پیکره مبنا برگزیده شد. ساخت های فعلی مرکب مربوط به 21 فعل سبک زایای زبان فارسی از آن استخراج شده است و پس از برچسب زنی در چارچوب صرف توزیعی (Halle & Marantz, 1993; Marantz, 2013) در قالب پیکره ای مشتمل بر بیش از 6000 ساخت فعل سبک در بیش از 2000000 بافت زبانی ارائه شده است که در بیش از 200000 بافت زبانی ارائه شده اند. مقایسه تعداد فعل های واژگانی زبان فارسی با تعداد ساخت های فعل سبک موجود در پیکره حاضر، بدیهی ترین عاملی است که وجود چنین پیکره ای در میان منابع زبان فارسی را ضرورت می بخشد. از سوی دیگر، ماهیت این پیکره، یعنی نمایش ساخت های فعل سبک در بافت های زبانی متفاوت، می تواند به پژوهشگران در یافتن پاسخ پرسش های موجود در رابطه با این ساخت ها، رد یا تأیید فرضیه ها و طرح نظریه های جدید کمک کند.