مطالب مرتبط با کلیدواژه

پیکره متنی


۱.

روش نوین انطباق هستی شناسی با استفاده از پیکره های متنی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: انطباق هستی شناسی یادگیری ماشین پیکره متنی روش نایوبیز شباهت معنایی

حوزه های تخصصی:
تعداد بازدید : ۱۴۶۲ تعداد دانلود : ۸۲۳
امروزه، استفاده از هستی شناسی برای مقاصد گوناگونی در حال گسترش است. اما، در مواقعی به خاطر تفاوت هایی که در ساخت هستی شناسی در مراکز مختلف وجود دارد، امکان تبادل دانش بین دو هستی شناسی میسر نیست. برای حل این مشکل، روش های مختلفی برای انطباق هستی شناسی ارائه شده است که برخی از آنها مبتنی بر فنون یادگیری ماشین است. انطباق هستی شناسی یا به عبارت دیگر تشخیص مفاهیم متناظر در هستی شناسی های مختلف دارای کاربرد های متنوعی است. در این مقاله، یک روش جدید ارائه شده است که با بهره گیری از یادگیری ماشین و نیز پیکره های متنی به عنوان منبع دانش از شباهت های معنایی بین هستی شناسی ها جهت انطباق استفاده می کند.
۲.

الگوپردازی مفهوم یابی از آیات قرآن کریم با استفاده از دانش متن کاوی رایانشی(مقاله پژوهشی حوزه)

کلیدواژه‌ها: روش تحقیق موضوعی در قرآن کریم مفهوم یابی متن کاوی پیکره متنی یادگیری ماشین

حوزه های تخصصی:
تعداد بازدید : ۸۵۹ تعداد دانلود : ۶۳۶
  هدف مقاله تعیین مسیری برای تبیین فناورانه مفهوم یابی از آیات قرآن است. مفهوم یابی یکی از مراحل اصلی روش تحقیق موضوعی در قرآن کریم است و در عین حال در سایر مطالعات مرتبط با فهم قرآن می تواند به کار گرفته شود. استفاده از دانش متن کاوی رایانشی برای پردازش متون، روشی متداول در فناوری دنیای امروز است. قرآن کریم نیز به عنوان یک متن و زبان مورد توجه این دانش قرار گرفته است. گام اول برای تحلیل هر متن تشکیل پیکره متنی است که متن را به داده های ساخت یافته تبدیل می کنند. در طراحی این پیکره ها از قواعد مختلفی از جمله قواعد متداول صرفی- نحوی استفاده می شود. آنچه انتظار داریم درنهایت به عنوان خروجی ماشین از آن بهره بگیریم، مفهوم یابی و استخراج دانش یا ابزارهایی برای تسهیل این کار است؛ لذا پس از تشکیل پیکره متنی، داده های نمونه برای استفاده در فرایند یادگیری ماشین برای مفهوم یابی آماده شده اند. این داده ها الگوهای ساده زبانی مبتنی بر پیکره متنی است که منجر به دریافت مفهوم می شود و می تواند در مراحل تکمیلی تدقیق شده، به سمت الگوهای پیشرفته سوق پیدا کند.
۳.

کاربرد پیکره های متنی در آموزش زبان آلمانی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیکره متنی زبان پرس وجوی پیکره زبانشناسی پیکره ای آموزش زبان صفت تفصیلی

حوزه های تخصصی:
تعداد بازدید : ۵۴۲ تعداد دانلود : ۵۴۳
در یادگیری زبان بیگانه، زبان آموز همواره با چالش های مختلفی دست و پنجه نرم می کند و بندرت قادر است بدون یاری گرفتن از افراد صاحب نظر پیشرفت قابل توجهی در مهارت های زبانی کسب کند. مقاله پیش رو با درنظرگرفتن همین محدودیت، به معرفی پیکره ها ی زبانی و چگونگی استفاده از آنها در امر آموزش زبان می پردازد. پیکره متنی امروزه به مجموعه ای از متون گفتاری و نوشتاری دیجیتالی شده گفته می شود که از نمونه های زبانی جمع آوری شده از حوزه های مختلف تشکیل شده و در پژوهش های زبانی مورد استفاده پژوهشگران قرار می گیرند. قصد نگارنده البته این نیست که با استفاده از پیکره به بررسی تحولات زبانی بپردازد، بلکه سعی بر این است تا نشان دهد، زبان آموزان نیز می توانند با استفاده از پیکره های متنی و مستقل از دیگران بر بسیاری از مشکلات مربوط به یادگیری زبان غلبه کنند. برای تبیین این مسئله روند تولید یک پیکره، شیوه جستجو در آن با استفاده زبان پرس و جوی پیکره و حل و فصل برخی از مشکلات زبانی شرح داده می شوند.
۴.

واکاوی اثربخشی برچسب گذاری معنایی در رفع ابهام معنایی هم نویسه های تخصصی از نظر میزان دقت در بازیابی متون علمی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: هم نویسه تخصصی بازیابی اطلاعات سازماندهی اطلاعات برچسب گذاری پیکره متنی

حوزه های تخصصی:
تعداد بازدید : ۳۱۰ تعداد دانلود : ۱۹۶
هدف: تبیین کاربرد روش برچسب گذاری پیکره متنی در رفع ابهام معنایی از هم نویسه های تخصصی از نظر میزان دقت در بازیابی متون علمی حاوی این گونه هم نویسه ها. روش: این پژوهش از حیث هدف کاربردی است که به روش تجربی انجام شد و در رفع ابهام معنایی، روشی با نظارت محسوب می شود. جامعه پژوهش را 442 مقاله علمی در قالب دو گروه گواه و آزمون تشکیل دادند. گروه گواه دارای 221 متن کامل مقاله بدون برچسب و گروه تجربی دارای همان 221 مقاله اما این بار برچسب گذاری شده، بود که در نظام بازیابی اطلاعات برای سنجش کارآیی برچسب ها در رفع ابهام معنایی از هم نویسه های تخصصی مورد آزمون قرار گرفتند. یافته ها : سطح معنی داری آزمون رتبه های علامت دار ویلکاکسون (0001/0 = P، 909/5- = Z) نشان می دهد که میزان دقت نتایج بازیابی هم نویسه های تخصصی بعد از به کارگیری پیکره تخصصی برچسب گذاری شده در نظام بازیابی اطلاعات نسبت به قبل از آن تفاوت معنی داری دارد. بررسی رتبه های منفی و مثبت نشان می دهد میزان دقت نتایج بعد از به کارگیری پیکره تخصصی برچسب گذاری شده به میزان معنی داری افزایش یافته و به حد بیشینه آن یعنی 1 رسیده است. نتیجه گیری: اگر طراحان سیستم های بازیابی بر بهینه سازی فرمول های بازیابی متمرکز شوند و نظام های بازیابی را برای جستجوی اسناد مرتبط توانمند سازند، پژوهشگران با هر ویژگی فیزیولوژیکی، تجربی و دانشی قادرند به اسناد مرتبط با نیاز اطلاعاتی خود با صرف زمانی اندک دسترسی یابند. در این پژوهش، ارزش پیکره متنی به عنوان گنجینه غنی دانش محور، در ایجاد تمایز نقش معنایی هم نویسه های تخصصی، آشکار شد.
۵.

تأثیر برچسب گذاری معنایی در رفع ابهام هم نویسه های تخصصی از نظر ریزش کاذب در بازیابی متون علمی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: هم نویسه های تخصصی برچسب گذاری معنایی ریزش کاذب پیکره متنی رفع ابهام معنایی

حوزه های تخصصی:
تعداد بازدید : ۵۳۶ تعداد دانلود : ۲۴۲
هدف: مسئله اصلی در بازیابی مؤثر و کاربرمدار هم نویسه های تخصصی، توسعه فرایندی است که بازیابی اطلاعات نامرتبط را به حداقل برساند (ریزش کاذب= ۰). در این مقاله سعی شده با به کارگیری رویکرد پیکره مدار با استفاده از برچسب گذاری معنایی، بازیابی مدارک حاوی هم نویسه های تخصصی ارزیابی و با راهبردهای موجود (بدون برچسب گذاری) مقایسه و یافته ها آشکار شود. هدف بهینه سازی کارایی نظام بازیابی اطلاعات در کاهش ریزش کاذب بازیابی متون علمی با استفاده از روش رفع ابهام معنایی از هم نویسه های تخصصی به کمک برچسب گذاری معنایی بوده است. روش: پژوهش به دلیل ماهیتش به روش تجربی انجام شد. روش تجربی از روش های سه گانه رفع ابهام معنایی (بانظارت، نیمه نظارتی و بدون نظارت) بوده و روشی بانظارت به شمار می رود. جامعه پژوهش را ۴۴۲ مقاله علمی در دو گروه گواه و آزمون تشکیل دادند. گروه گواه (پایه) شامل ۲۲۱ متن کامل مقاله بدون برچسب و گروه تجربی (آزمون) شامل همان ۲۲۱ مقاله، اما دارای برچسب بود که ۴۶ هم نویسه تخصصی آن ها به روش دستی برچسب گذاری شد و در نظام بازیابی پیشنهادی قرارگرفتند و برای بررسی کارآیی برچسب ها در رفع ابهام معنایی، از هم نویسه های تخصصی و کاهش ریزش کاذب آزموده شدند. یافته ها: بازیابی در مقاله های گروه گواه به دلیل ابهام معنایی هم نویسه های تخصصی، با ریزش کاذب همراه بود؛ درحالی که برچسب گذاری هم نویسه های تخصصی در متن کامل مقاله های گروه تجربی، تأثیر مستقیمی در کاهش ریزش کاذب داشت. سطح معنی داری آزمون رتبه های علامت دار ویلکاکسون (۰/۰۰۰۱ = P، ۵/۹۰۹- = Z) نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به کارگیری پیکره تخصصی برچسب گذاری شده در نظام بازیابی اطلاعات به نسبت قبل، تفاوت معنا داری داشت. بررسی رتبه های منفی و مثبت نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به کارگیری پیکره تخصصی برچسب گذاری شده به میزان معنا داری کاهش یافته است. نتیجه گیری: حد ریزش کاذب در یافته های پژوهش، گواه عملکرد قابل قبول برچسب گذاری در رفع ابهام معنایی هم نویسه های تخصصی است. همچنین بیانگر نقش مؤثر آن در بهینه سازی نظام بازیابی اطلاعات برای به حداقل رساندن ریزش کاذب نتایج است. بنابراین، رویکرد پیکره مدار نظام بازیابی اطلاعات، ضمن فراهم آوردن بستر بازیابی تمام متن، زمینه جلوگیری از ریزش کاذب و صرفه جویی در وقت و انرژی کاربران را فراهم خواهد کرد. گفتنی است برای رفع ابهام معنایی هم نویسه های تخصصی، برچسب ها منابع ارزشمندی اند، اما این مستلزم بهره مندی از مجموعه آموزش باکیفیت است. نتایج پژوهش نشان می دهد که داده های آموزشی، که به خوبی ساختاربندی شده باشند، نقش بسیار مهمی در بهبود رفع ابهام معنایی هم نویسه های تخصصی ایفا می کنند. این پژوهش به صورت تجربی و تحلیلی نشان داد که رویکرد پیکره مدار در مقایسه با جست وجوی مبتنی بر کلیدواژه، به طور معنا داری سطح ایده آلی از ریزش کاذب را به دست می دهد. روش به کاررفته برای رفع ابهام معنایی هم نویسه های تخصصی در همه زبان ها کاربرد دارد. 
۶.

بررسی و تحلیل استعاره های مفهومی در پیکره متنی دانش آموزان پیش دانشگاهی در رشته های مختلف تحصیلی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: استعاره مفهومی پیکره متنی استعاره عینی به عینی استعاره جاندار بنیاد استعاره عینی به ذهنی

حوزه های تخصصی:
تعداد بازدید : ۱۹۰ تعداد دانلود : ۱۵۰
این پژوهش با هدف تحلیل استعاره های مفهومی تولید شده در نوشتار دانش آموزان دوره پیش دانشگاهی، پیکره زبانی فرهنگستان زبان و ادبیات فارسی را بررسی کرده که این پیکره در طی آزمون پیشرفت تحصیلی کشوری با نام آزمون «امزا» گردآوری شده است. استعاره های مفهومی در 272 متن از دانش آموزان سه رشته علوم تجربی، انسانی و ریاضی براساس طبقه بندی پیشنهادی افراشی و حسامی (1392) استخراج و تحلیل شد. نتایج تحلیل آماری نشان می دهد استفاده از استعاره های مفهومی در دختران بیشتر از پسران بوده و این اختلاف از لحاظ آماری معنی دار است. بین فراوانی استفاده از کل استعاره های مفهومی دانش آموزان رشته های مختلف تحصیلی، در سطح خطای 5 درصد تفاوت آماری یافت نشد و دانش آموزان رشته های مختلف به یک میزان از استعاره های مفهومی در نوشتار خود استفاده کرده اند. در بین انواع استعاره، بسامد کاربرد استعاره عینی به ذهنی، عینی به عینی و جهتی به ترتیب بیشتر از سایر انواع استعاره ها بوده و در بین انواع استعاره های عینی به ذهنی نیز، بسامد کاربرد استعاره ظرف بنیاد و ساختار بنیاد بیشتر از سایر انواع بوده و اختلاف آن با سایر انواع از لحاظ آماری معنی دار است. بررسی حوزه های مبدأ و مقصد در استعاره های مفهومی نشان می دهد مفاهیم «انسان، مکان، ظرف، جسم و شیء و بالا» به ترتیب پربسامدترین حوزه های مفهومی مبدأ و «آسمان، زندگی، زمان، آینده و خدا» پربسامدترین حوزه های مفهومی مقصد در داده های پژوهش هستند و این حوزه های مبدأ و مقصد در نوشتار دانش آموزان منطبق با دسته بندی کووچش (2010) و البته متنوع تر از آن است.
۷.

واکاوی تأثیر برچسب گذاری معنایی در ابهام زدایی هم نویسه های تخصصی از نظر کیفیت بازیابی (معیار F) در بازیابی متون علمی(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۲۰ تعداد دانلود : ۱۲۴
با توجه به نقش مهم و تعیین کننده واژگان تخصصی در مسیریابی دقیق و کامل پژوهش های علمی، هدف از پژوهش حاضر، تبیین میزان اثربخشی برچسب گذاری معنایی در رفع ابهام هم نویسه های تخصصی و کیفیت بازیابی حاصل از آن بود. این پژوهش از حیث هدف کاربردی و از حیث روش شناسی، از نوع کاربردشناسی تجربی یا پیکره ای است و روشی با نظارت محسوب می شود. از جمله فنون پردازش زبان طبیعی که برای دستیابی به هدف پژوهش به کار گرفته شد تحلیل ریخت شناسی و برچسب گذاری معنایی هم نویسه های تخصصی بود. جامعه پژوهش را 442 مقاله علمی در قالب دو گروه کنترل و آزمون تشکیل دادند. گروه کنترل دارای 221 متن کامل مقاله بدون برچسب و گروه تجربی دارای همان 221 مقاله اما این بار برچسب گذاری شده، بود که در نظام بازیابی اطلاعات برای تبیین اثربخشی برچسب گذاری معنایی در ابهام زدایی هم نویسه های تخصصی و کیفیت بازیابی متون علمی آزموده شدند. سطح معنی داری آزمون ویلکاکسون نشان داد که میزان کیفیت بازیابی نتایج بعد از به کارگیری پیکره تخصصی برچسب گذاری شده نسبت به قبل از آن تفاوت معنی داری دارد. بررسی رتبه های منفی و مثبت نشان داد این میزان به طور معنی داری افزایش یافته و به حد بیشینه آن یعنی 1 رسیده است. به عبارت دیگر در روش آزموده شده ی این پژوهش، فراخوانی و دقت که هر دو در تعیین میزان کیفیت بازیابی (معیار F ) تأثیر دارند در حد بهینه آن یعنی 1 به دست آمد. از یافته های پژوهش حاضر چنین برمی آید که لزوما بین فراخوانی و دقت رابطه معکوس وجود ندارد و این دو می توانند به موازات یکدیگر به حد بیشینه خود برسند. کارایی بهتر نظام بازیابی با استفاده از این رویکرد، به دلیل تجهیز نظام بازیابی به برچسب های موضوعی و در نتیجه آن توانمندسازی این نظام به تمایز موضوعی هم نویسه های تخصصی است. تعبیه مجموعه آموزش در ساختار نظام بازیابی، اطلاعات افزوده ای را فراهم می کند تا در خدمت نظام بازیابی برای تمایز بین معانی متعدد هم نویسه های تخصصی قرار گیرد. این ابزار، یکی از عناصری است که کیفیت بهینه بازیابی را موجب می شود و نظام بازیابی اطلاعات را هنگام بازیابی متون حاوی هم نویسه های تخصصی از بازیابی واژه محور به سمت بازیابی محتوامحور سوق می دهد.