مطالب مرتبط با کلیدواژه

زبانشناسی پیکره ای


۱.

دوگان سازی کامل در زبان فارسی: بررسی پیکره بنیاد(مقاله علمی وزارت علوم)

کلیدواژه‌ها: ساختواژه تکرار کامل لغتنامه ی دهخدا زبانشناسی پیکره ای صورت و معنا

حوزه های تخصصی:
  1. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم کتابداری نمایه سازی و چکیده نویسی
  2. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم کتابداری موضوعات خاص و کتابخانه ها و کتابداری
تعداد بازدید : ۹۹۳ تعداد دانلود : ۸۸۰
فرایند تکرار یکی از فرایند های صرفی زایا ست که درباره ی آن در زبانهای مختلف و در چهار چوب نظریات مختلف زبانشناختی (دستور زایشی ، نظریه بهینگی و برنامه کمینگی ) مطالعات جامعی صورت گرفته است.اکنون با رشد زبانشناسی پیکره ای و مطالعات پیکره بنیاد می توان پژوهش های صرفی از این دست را دقیق تر به سامان رساند. تکرار در دونوع کامل و ناقص از سوی زبانشناسان (شقاقی 1389، هسپلمت 2002 و بائر 2003) بررسی شده است. تکرار کامل به معنای تکرار کامل یک پایه موسوم به جزء دو گانی است و تکرار ناقص به معنای افزودن جزئی به آغاز یا پایان یکی از پایه هاست. در این مقاله نوع کامل این فرایند زایای صرفی رادر زبان فارسی مورد بررسی قرار داده ایم تا به معانی و ساختار های غالب حاصل از آن و ویژگی های معنایی جزء دوگانی دست یابیم. برای دستیابی به این ویژگی ها به کمک زبانشناسی پیکره ای به پیکره ای جامع و قابل قبول در زبان فارسی نیاز بود که برای برای پژوهش حاضر لغتنامه متوسط دهخدا انتخاب شد. نخست کلیه ی دوگانی های کامل موجود در فرهنگ متوسط دهخدا به همراه توضیحات مربوط به ساخت آنها و معانی اشان استخراج شدند. تعداد دوگانی ها ی استخراج شده 299 مورد بود و آنگاه این داده ها بر اساس ساختار ، معنا و ویژگی های جزء دوگانی دسته بندی شدند. پس از بررسی معانی و ساختار ها نتایج جالبی به دست آمد. نتایج حاصل از بررسی و طبقه بندی داده ها نشان می دهند که به غیر از اصوات ساخت غالب در دوگان سازی ها قید است و به لحاظ معنا ، معنای غالب معنای قلت است و درصد غالب ساختها از عناصر معنا دار تشکیل شده اند. دیگر آنکه حتی اجزاء بی معنا نیز در ایجاد ساخت دو گانی شرکت کرده اند و در موارد متعددی معنای ساخت حاصل ربطی به معنای اجزاء دو گانی ندارد و معنایی کاملا جدید و متفاوت ایجاد شده است. در این میان تعداد نام آواها یا اصوات یک سوم ساختهارا تشکیل می دهند که حتی اصوات نیز نوعی معنا از خود ارائه می دهند و همه ی آنها فاقد معنا نیستند.نتایج حاصل از این پژوهش پیکره بنیاد در آموزش زبان فارسی ، تهیه پیکره های دوزبانه و نیز تسهیل فرایند ترجمه ماشینی کار آمد باشد و نخستین حاصل آن پیکره ای نسبتا جامع از دو گانی های کامل در زبان فارسی است که در شبکه های واژگانی بسیار کار آمد است.
۲.

استخراج خودکار جملات هم تراز انگلیسی-فارسی از متون مقایسه ای با بهره برداری از اطلاعات نحوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استخراج خودکار جملات همتراز زبانشناسی پیکره ای پیکره مقایسه ای پیکره موازی

حوزه های تخصصی:
تعداد بازدید : ۴۵۹ تعداد دانلود : ۳۹۳
پیکره های موازی همواره از غنی ترین منابع در مباحث پردازش زبان طبیعی محسوب می شوند.  این نوع پیکره ها شامل متون ترجمه شده دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم ترازشده اند. علیرغم کاربرد فراوان این نوع پیکره ها در مطالعات مختلف از جمله پژوهش های زبانی، ترجمه ماشینی آماری و سامانه های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره های موازی مواجه بوده اند. در این راستا، در پژوهش حاضر سعی شده است به منظور تولید پیکره موازی با بهره گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم ترازانگلیسی/فارسی از متون مقایسه ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره گیری از اطلاعات نحوی جملات، یک مدل هم ترازی آموزش داده می شود. دقت مدل هم ترازی،در بهترین حالت، به شکل عملیاتی روی داده های آزمون (208 عدد جفت جمله) 77% و روی داده های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم های آموزش مورد استفاده قرار گرفت. به منظور افزایش دقت، از یک الگوریتم جست وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به کارگیری مدل هم ترازی به دست آمده، به تولید ابزار هم ترازی دانشگاه اصفهان منجر شد، که می تواند به منظور خودکفایی در تولید پیکره های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.
۳.

کاربرد پیکره های متنی در آموزش زبان آلمانی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیکره متنی زبان پرس وجوی پیکره زبانشناسی پیکره ای آموزش زبان صفت تفصیلی

حوزه های تخصصی:
تعداد بازدید : ۵۳۴ تعداد دانلود : ۵۳۵
در یادگیری زبان بیگانه، زبان آموز همواره با چالش های مختلفی دست و پنجه نرم می کند و بندرت قادر است بدون یاری گرفتن از افراد صاحب نظر پیشرفت قابل توجهی در مهارت های زبانی کسب کند. مقاله پیش رو با درنظرگرفتن همین محدودیت، به معرفی پیکره ها ی زبانی و چگونگی استفاده از آنها در امر آموزش زبان می پردازد. پیکره متنی امروزه به مجموعه ای از متون گفتاری و نوشتاری دیجیتالی شده گفته می شود که از نمونه های زبانی جمع آوری شده از حوزه های مختلف تشکیل شده و در پژوهش های زبانی مورد استفاده پژوهشگران قرار می گیرند. قصد نگارنده البته این نیست که با استفاده از پیکره به بررسی تحولات زبانی بپردازد، بلکه سعی بر این است تا نشان دهد، زبان آموزان نیز می توانند با استفاده از پیکره های متنی و مستقل از دیگران بر بسیاری از مشکلات مربوط به یادگیری زبان غلبه کنند. برای تبیین این مسئله روند تولید یک پیکره، شیوه جستجو در آن با استفاده زبان پرس و جوی پیکره و حل و فصل برخی از مشکلات زبانی شرح داده می شوند.
۴.

بررسی تطبیقی ویژگی های زمان دستوری و نمود در زبان های فارسی و چینی براساس زبانشناسی پیکره ای

نویسنده:

کلیدواژه‌ها: زمان دستوری نمود در دستور زبان بررسی تطبیقی زبان فارسی زبان چینی زبانشناسی پیکره ای

حوزه های تخصصی:
تعداد بازدید : ۱۱۸ تعداد دانلود : ۱۰۲
دو مقوله زمان دستوری و نمود در دستور زبان جایگاه ویژه ای دارند. با کمک زمان دستوری می توان به بیان یک عمل یا رویداد در زمان گذشته، حال یا آینده پرداخت و با کمک نمود می توان، شروع، پیشرفت یا پایان عمل یا رویدادی را نشان داد. از آنجاکه این دو مقوله و نوع بازنمایی آن ها در هر یک از زبان های فارسی و چینی ویژگی های مخصوص به خود را دارند و پژوهش های تطبیقی بسیار کمی در این حوزه صورت گرفته است، پژوهش حاضر با کمک زبانشناسی پیکره ای، به کمک آمار و با بهره گیری از روش-های تحلیل کمی و کیفی درصدد یافتن ویژگی های این دو مقوله و کشف شباهت ها و تفاوت های آن ها در این دو زبان است. از نتایج حاصل از این پژوهش می توان در حوزه های آموزش زبان، دستور زبان و ترجمه بهره برد. این پژوهش با مشاهده و بررسی 9189 گزاره شامل 4172 گزاره فارسی و ترجمه متناظر آن ها به چینی و 5017 گزاره چینی و ترجمه متناظر آن ها به فارسی از دو رمان «بوف کور» به زبان فارسی و «دویدن در خیابان های پکن» به زبان چینی و ترجمه متناظر آن ها به چینی و فارسی استخراج شده اند. از این داده ها پیکره دو زبانه ا ی فارسی- چینی و چینی- فارسی ساخته شده است و با مشاهده دگرگونی های به وجود آمده در فرایند ترجمه در ساختار هر یک از این گزاره ها، ویژگی های مربوط به ان ها، شباهت ها و تفاوت های اساسی و نوع بازنمایی زمان دستوری و نمود در این دو زبان به دست آمده است. در زبان فارسی، فعل، نقش کلیدی را در جمله دارد و حاوی اطلاعات دستوری نظیر زمان دستوری و نمود است. اما در زبان چینی، اسم، در جمله نقش کلیدی دارد و در بسیاری از جملات فعل، قابل حذف است. از همین روی نمی توان دسته بندی مشخصی برای زمان دستوری در زبان چینی قائل شد.