زبانشناسی پیکره ای

۱.

دوگان سازی کامل در زبان فارسی: بررسی پیکره بنیاد(مقاله علمی وزارت علوم)

نویسنده: بهروز محمودی بختیاری زهره ذوالفقار کندری

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره ۳۱ پاییز ۱۳۹۴ شماره ۱ (پیاپی ۸۳)

کلیدواژه‌ها: ساختواژه تکرار کامل لغتنامه ی دهخدا زبانشناسی پیکره ای صورت و معنا

حوزه‌های تخصصی:

تعداد بازدید : ۱۱۸۸ تعداد دانلود : ۱۰۵۹

فرایند تکرار یکی از فرایند های صرفی زایا ست که درباره ی آن در زبانهای مختلف و در چهار چوب نظریات مختلف زبانشناختی (دستور زایشی ، نظریه بهینگی و برنامه کمینگی ) مطالعات جامعی صورت گرفته است.اکنون با رشد زبانشناسی پیکره ای و مطالعات پیکره بنیاد می توان پژوهش های صرفی از این دست را دقیق تر به سامان رساند. تکرار در دونوع کامل و ناقص از سوی زبانشناسان (شقاقی 1389، هسپلمت 2002 و بائر 2003) بررسی شده است. تکرار کامل به معنای تکرار کامل یک پایه موسوم به جزء دو گانی است و تکرار ناقص به معنای افزودن جزئی به آغاز یا پایان یکی از پایه هاست. در این مقاله نوع کامل این فرایند زایای صرفی رادر زبان فارسی مورد بررسی قرار داده ایم تا به معانی و ساختار های غالب حاصل از آن و ویژگی های معنایی جزء دوگانی دست یابیم. برای دستیابی به این ویژگی ها به کمک زبانشناسی پیکره ای به پیکره ای جامع و قابل قبول در زبان فارسی نیاز بود که برای برای پژوهش حاضر لغتنامه متوسط دهخدا انتخاب شد. نخست کلیه ی دوگانی های کامل موجود در فرهنگ متوسط دهخدا به همراه توضیحات مربوط به ساخت آنها و معانی اشان استخراج شدند. تعداد دوگانی ها ی استخراج شده 299 مورد بود و آنگاه این داده ها بر اساس ساختار ، معنا و ویژگی های جزء دوگانی دسته بندی شدند. پس از بررسی معانی و ساختار ها نتایج جالبی به دست آمد. نتایج حاصل از بررسی و طبقه بندی داده ها نشان می دهند که به غیر از اصوات ساخت غالب در دوگان سازی ها قید است و به لحاظ معنا ، معنای غالب معنای قلت است و درصد غالب ساختها از عناصر معنا دار تشکیل شده اند. دیگر آنکه حتی اجزاء بی معنا نیز در ایجاد ساخت دو گانی شرکت کرده اند و در موارد متعددی معنای ساخت حاصل ربطی به معنای اجزاء دو گانی ندارد و معنایی کاملا جدید و متفاوت ایجاد شده است. در این میان تعداد نام آواها یا اصوات یک سوم ساختهارا تشکیل می دهند که حتی اصوات نیز نوعی معنا از خود ارائه می دهند و همه ی آنها فاقد معنا نیستند.نتایج حاصل از این پژوهش پیکره بنیاد در آموزش زبان فارسی ، تهیه پیکره های دوزبانه و نیز تسهیل فرایند ترجمه ماشینی کار آمد باشد و نخستین حاصل آن پیکره ای نسبتا جامع از دو گانی های کامل در زبان فارسی است که در شبکه های واژگانی بسیار کار آمد است.

۲.

استخراج خودکار جملات هم تراز انگلیسی-فارسی از متون مقایسه ای با بهره برداری از اطلاعات نحوی(مقاله علمی وزارت علوم)

نویسنده: رضوان متولیان امیرحسن منجمی ابراهیم قدس اللهی

منبع: پژوهش های زبان شناسی سال دهم پاییز و زمستان ۱۳۹۷ شماره ۲ (پیاپی ۱۹) 15 - 36

کلیدواژه‌ها: استخراج خودکار جملات همتراز زبانشناسی پیکره ای پیکره مقایسه ای پیکره موازی

حوزه‌های تخصصی:

حوزه‌های تخصصی زبان شناسی

تعداد بازدید : ۶۳۷ تعداد دانلود : ۵۷۰

پیکره های موازی همواره از غنی ترین منابع در مباحث پردازش زبان طبیعی محسوب می شوند. این نوع پیکره ها شامل متون ترجمه شده دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم ترازشده اند. علیرغم کاربرد فراوان این نوع پیکره ها در مطالعات مختلف از جمله پژوهش های زبانی، ترجمه ماشینی آماری و سامانه های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره های موازی مواجه بوده اند. در این راستا، در پژوهش حاضر سعی شده است به منظور تولید پیکره موازی با بهره گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم ترازانگلیسی/فارسی از متون مقایسه ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره گیری از اطلاعات نحوی جملات، یک مدل هم ترازی آموزش داده می شود. دقت مدل هم ترازی،در بهترین حالت، به شکل عملیاتی روی داده های آزمون (208 عدد جفت جمله) 77% و روی داده های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم های آموزش مورد استفاده قرار گرفت. به منظور افزایش دقت، از یک الگوریتم جست وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به کارگیری مدل هم ترازی به دست آمده، به تولید ابزار هم ترازی دانشگاه اصفهان منجر شد، که می تواند به منظور خودکفایی در تولید پیکره های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.

۳.

کاربرد پیکره های متنی در آموزش زبان آلمانی(مقاله علمی وزارت علوم)

نویسنده: حسن پروان حسین سرکار حسن خان

منبع: پژوهش های زبانشناختی در زبانهای خارجی دوره ۸ پاییز و زمستان ۱۳۹۷ شماره ۲ 449 - 474

کلیدواژه‌ها: پیکره متنی زبان پرس وجوی پیکره زبانشناسی پیکره ای آموزش زبان صفت تفصیلی

حوزه‌های تخصصی:

حوزه‌های تخصصی زبان شناسی

تعداد بازدید : ۷۵۲ تعداد دانلود : ۷۳۳

در یادگیری زبان بیگانه، زبان آموز همواره با چالش های مختلفی دست و پنجه نرم می کند و بندرت قادر است بدون یاری گرفتن از افراد صاحب نظر پیشرفت قابل توجهی در مهارت های زبانی کسب کند. مقاله پیش رو با درنظرگرفتن همین محدودیت، به معرفی پیکره ها ی زبانی و چگونگی استفاده از آنها در امر آموزش زبان می پردازد. پیکره متنی امروزه به مجموعه ای از متون گفتاری و نوشتاری دیجیتالی شده گفته می شود که از نمونه های زبانی جمع آوری شده از حوزه های مختلف تشکیل شده و در پژوهش های زبانی مورد استفاده پژوهشگران قرار می گیرند. قصد نگارنده البته این نیست که با استفاده از پیکره به بررسی تحولات زبانی بپردازد، بلکه سعی بر این است تا نشان دهد، زبان آموزان نیز می توانند با استفاده از پیکره های متنی و مستقل از دیگران بر بسیاری از مشکلات مربوط به یادگیری زبان غلبه کنند. برای تبیین این مسئله روند تولید یک پیکره، شیوه جستجو در آن با استفاده زبان پرس و جوی پیکره و حل و فصل برخی از مشکلات زبانی شرح داده می شوند.

۴.

بررسی تطبیقی ویژگی های زمان دستوری و نمود در زبان های فارسی و چینی براساس زبانشناسی پیکره ای(مقاله علمی وزارت علوم)

نویسنده: تهمینه بازدار

منبع: مطالعات آموزش زبان فارسی سال ۹ بهار و تابستان ۱۴۰۲ شماره ۱۶ 211 - 237

کلیدواژه‌ها: زمان دستوری نمود در دستور زبان بررسی تطبیقی زبان فارسی زبان چینی زبانشناسی پیکره ای

حوزه‌های تخصصی:

حوزه‌های تخصصی ادبیات

تعداد بازدید : ۲۸۳ تعداد دانلود : ۲۸۱

دو مقوله زمان دستوری و نمود در دستور زبان جایگاه ویژه ای دارند. با کمک زمان دستوری می توان به بیان یک عمل یا رویداد در زمان گذشته، حال یا آینده پرداخت و با کمک نمود می توان، شروع، پیشرفت یا پایان عمل یا رویدادی را نشان داد. از آنجاکه این دو مقوله و نوع بازنمایی آن ها در هر یک از زبان های فارسی و چینی ویژگی های مخصوص به خود را دارند و پژوهش های تطبیقی بسیار کمی در این حوزه صورت گرفته است، پژوهش حاضر با کمک زبانشناسی پیکره ای، به کمک آمار و با بهره گیری از روش-های تحلیل کمی و کیفی درصدد یافتن ویژگی های این دو مقوله و کشف شباهت ها و تفاوت های آن ها در این دو زبان است. از نتایج حاصل از این پژوهش می توان در حوزه های آموزش زبان، دستور زبان و ترجمه بهره برد. این پژوهش با مشاهده و بررسی 9189 گزاره شامل 4172 گزاره فارسی و ترجمه متناظر آن ها به چینی و 5017 گزاره چینی و ترجمه متناظر آن ها به فارسی از دو رمان «بوف کور» به زبان فارسی و «دویدن در خیابان های پکن» به زبان چینی و ترجمه متناظر آن ها به چینی و فارسی استخراج شده اند. از این داده ها پیکره دو زبانه ا ی فارسی- چینی و چینی- فارسی ساخته شده است و با مشاهده دگرگونی های به وجود آمده در فرایند ترجمه در ساختار هر یک از این گزاره ها، ویژگی های مربوط به ان ها، شباهت ها و تفاوت های اساسی و نوع بازنمایی زمان دستوری و نمود در این دو زبان به دست آمده است. در زبان فارسی، فعل، نقش کلیدی را در جمله دارد و حاوی اطلاعات دستوری نظیر زمان دستوری و نمود است. اما در زبان چینی، اسم، در جمله نقش کلیدی دارد و در بسیاری از جملات فعل، قابل حذف است. از همین روی نمی توان دسته بندی مشخصی برای زمان دستوری در زبان چینی قائل شد.

۵.

تحلیلی بر پیکرۀ برچسب گذاری شدۀ حاصل از محتوای کتاب های درسی پایه های اول تا ششم ابتدایی(مقاله علمی وزارت علوم)

نویسنده: مسعود قیومی الهام صالحی اعظم علیجانی

منبع: زبان و زبان شناسی دوره ۲۰ بهار و تابستان ۱۴۰۳ شماره ۳۹ 155-192

کلیدواژه‌ها: پیکره زبانشناسی پیکره ای آموزش سیاست گذاری در آموزش

حوزه‌های تخصصی:

حوزه‌های تخصصی زبان شناسی

تعداد بازدید : ۱۵۳ تعداد دانلود : ۱۲۴

در سند نقشه جامع علمی کشور، به ارتقای جایگاه زبان فارسی در مقام زبان علم در بین زبان های بین المللی علمی اشاره شده است. یکی از راه کارهای رسیدن به این هدف کلان، گسترش زبان فارسی ذکر شده است. برای رسیدن به این هدف که می تواند در حوزه سیاستگذاری های مربوط به زبان فارسی مطرح شود، به درک بیشتر از محتوای زبانی نیاز است. از این منظور، کتاب های درسی دانش آموزان که با مفاهیم پایه آموزش می بینند اهمیت زیادی پیدا می کند. توصیف این ویژگی ها می تواند به هنگام تهیه محتوای زبانی مد نظر قرار گیرد. در این پژوهش، پیکره ای از متون درسی کلاس های اول تا ششم ابتدایی به حجمی در حدود 208هزار واژه تهیه شده و برچسب گذاری شده است. این دروس شامل فارسی، علوم، مطالعات اجتماعی و هدیه های آسمانی است. تمام جملات دروس مختلف به تفکیک پایه و درس، در فایل های متنی ساده حروف نگاری شده و پس از هنجارسازی در فرایند پیش پردازش، در چهار سطح آوایی، بن واژه-ای، مقوله دستوری و تجزیه سازه ای نحوی برچسب گذاری شده و بررسی شده است. نتایج حاصل از این می تواند به شناخت بیشتر از محتوای کتاب های درسی کمک کند و در حوزه آموزش و سیاستگذاری در این حوزه مفید باشد.

۶.

متن مقدس و تحلیل گفتمان: طبقه بندی متون مقدس یارسان بر اساس تحلیل گفتمان پیکره بنیاد

نویسنده: رحمان ویسی حصار سیروس امیری زانیار نقشبندی

منبع: تحلیل گفتمان ادبی دوره ۲ تابستان ۱۴۰۳ شماره ۲ 113 - 157

کلیدواژه‌ها: تحلیل گفتمان زبانشناسی پیکره ای متون مقدس سنت یارسان گواهی زبان کردی

حوزه‌های تخصصی:

حوزه‌های تخصصی ادبیات علوم ادبی رویکردهای نقد ادبی تحلیل گفتمان

تعداد بازدید : ۳۹ تعداد دانلود : ۴۷

هدف مقاله حاضر بررسی و طبقه بندی انواع متون مقدّس در آیین یارسان بر اساس زبانشناسی پیکره ای است. در این راستا، روشی ترکیبی (کیفی و کمی) برای تحلیل متون مذکور مورد استفاده قرار می گیرد. به عبارت دیگر، ابتدا ساختار گفتمانی و روایی متون مورد نظر با تکیه بر روش تحلیل گفتمان تبیین شده، و سپس فهرست کلمات پربسامد و همچنین فهرست کلمات کلیدی هر متن با کمک زبانشناسی پیکره ای استخراج می شود. نتایج نشان می دهد که عمده متون کلامی را می توان به چهار گروه متفاوت تقسیم کرد. گروه اول شامل متونی است که کلام های روایی نامیده می شوند. یک کلام روایی عمدتاً شامل تعدادی مرمو (یک بند که شامل کلامی مستقیم توسط یک شخصیت مقدس است) است که اپیزودهای یک گفتمان روایی را تشکیل می دهند. این گروه به دو دسته فرعی قابل تقسیم است. متون گروه دوم که متون گواهی محور نامیده می شوند عمدتاً در راستای ارائه گواهی و شهادت درباره تجلی ها و تناسخات ذوات مقدس در تاریخ است. هر مرمو در این متون نشانگر یک گواهی توسط یک شخصیت مقدس است. یافته ها نشان می دهد که این گونه از متون (که توسط برخی کوچ نیز نامیده می شود) از کانونی ترین متون در آیین یارسان است. گروه سوم نیز که به صورت متون آیینی-اجرایی نامگذاری می شوند شامل متونی هستند که عمدتاً در مراسمات مذهبی و آیینی اجرا می شوند. در نهایت، گروه چهارم حاوی متون خاصی است که در هیچ کدام از گروه های فوق قرار نمی گیرند و به صورت متون مستقل سبک شناختی ظاهر می شوند. در پایان، کارکرد و سرشت فرهنگی هر گروه تبیین خواهد شد.