هانیه حبیبی

هانیه حبیبی

مطالب

فیلتر های جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

تحلیل عبارات احتیاط آمیز در پیکره زبانی آکادمیک فردوسی: مقایسه ی دو حوزه علوم انسانی و علوم پایه(مقاله علمی وزارت علوم)

کلید واژه ها: پیکره مقالات علمی- پژوهشی زبان فارسی اعضای هیات علمی عبارات احتیاط آمیز

حوزه های تخصصی:
تعداد بازدید : ۱۹۵ تعداد دانلود : ۱۵۶
پیکره شامل متن های پیوسته طبیعی است که به صورت الکترونیکی ارائه شده است و می توان از آن اطلاعات درباره عناصر زبانی، به صورت واژگانی و غیرواژگانی در کم ترین زمان ممکن و با بالاترین میزان دقت، استخراج نمود. نویسندگان این مقاله، پیکره زبانی آکادمیک فردوسی را ایجاد کرده و هدف از این مقاله معرفی پیکره اعضای هیات علمی دانشگاه فردوسی مشهد و به کارگیری آن در تحلیل و توصیف عبارات احتیاط آ میز در دو حوزه علومانسانی و علومپایه است. عبارات احتیاط آمیز میزان قطعیت کلام نویسنده را با کلماتی مانند «شاید»، «ممکن است» و «حتما» مشخص می کند. پژوهش هایی که تاکنون بر روی این عبارات انجام شده است، با داده هایی اندک و به صورت کاملا دستی انجام شده اند. در این پژوهش ضمن استفاده از دسته بندی سلاجرمیر (1997) برای شناسایی عبارات احتیاط آمیز، داده ها با استفاده از پیکره الکترونیکی ساخته شده که شامل 1100 مقاله زبان فارسی می باشد، استخراج شدند. بر اساس نتایج حاصل از این پژوهش میزان کاربرد عبارات احتیاط آمیز در حوزه علوم انسانی حدود دو برابر بیشتر از حوزه علوم پایه بود. در این میان استفاده از شرطی ها و عبارات حاکی از شک و تردید در هر دو حوزه بسامد بالایی داشتند. نتایج حاصل از این پژوهش به علت بالاتر بودن حجم داده های مورد استفاده نسبت به تحقیقات پیشین، قابلیت تعمیم بیشتری به عنوان الگو در نوشتن مقالات علمی زبان فارسی را دارا هستند. همچنین تأیید شد پیکره ساخته شده در این پژوهش که تا 96 درصد دقت دارد، به عنوان منبع بسیار خوبی برای تحلیل و تحقیق بر روی متون علمی قابل استفاده است.
۲.

استخراج اطلاعات از پیکره زبانی: معرفی پیکره مقاله های علمی پژوهشی دانشگاه فردوسی مشهد(مقاله علمی وزارت علوم)

کلید واژه ها: پیکره زبانی برچسب دهی مقاله های علمی پژوهشی دانشگاه فردوسی مشهد

حوزه های تخصصی:
تعداد بازدید : ۳۴۵ تعداد دانلود : ۳۱۰
هدف: پردازش زبان طبیعی، استفاده در فرهنگ نگاری، پیگیری تحولات زبانی و استخراج اطلاعات زبانی خاص از مهم ترین کاربردهای پیکره است. هدف از انجام این پژوهش معرفی و توصیف چگونگی ساخت پیکره مقاله های علمی پژوهشی است که نگارندگان پدید آورده اند. روش: برای ایجاد پیکره، نخست نرم افزار پیکره ساز طراحی و ساخته شد. این نرم افزار انواع فرمت از جمله doc،docx ،rtf ،txt  و pdf را پشتیبانی می کند. همچنین می توان پارامترهای ساخت پیکره را از قبل نیز برای آن تعیین کرد. برای مثال، مشخص کرد که حداقل تعداد توکن فایل برای حضور یک متن در پیکره چه عددی باشد. سپس مجموعه مقاله های علمی پژوهشی اعضای هیئت علمی دانشگاه فردوسی مشهد جمع آوری شد. مجموع مقاله های مشتمل بر 7.154.202 کلمه و 1100 عنوان است. کلّ پیکره در فایل های مجزا به جمله های تشکیل دهنده آن تجزیه شد. ریشه کلمات استخراج و برچسب نحوی کلمات زده شد. علاوه بر امکان استخراج اطلاعات به طور مستقیم، نرم افزار جانبی دیگری با کاربرد ساده تر  برای استخراج اطلاعات آماری نیز طراحی و به آن افزوه شد تا کاربران غیرتخصصی هم بتوانند از آن استفاده و اطلاعات را استخراج کنند. یافته: برای ارزیابی درستیِ  ابزارهای ریشه یاب و برچسب زنی مقوله های گفتار، از پیکره های استاندارد موجود مانند پیکره PerDT  (در سایت دادگان) که شامل تعداد قابل توجهی جمله برچسب خورده با اطلاعات نحوی و ساخت واژی است استفاده شد. همچنین با مطالعه موردی عبارات احتیاط آمیز (بخشی از طرح پژوهشی که به چاپ نرسیده است) یافته این پژوهش که ساخت پیکره مقاله های علمی پژوهشی است آزمایش و با دقت حدود96% تأیید شد. نتیجه: بر اساس نتایج  به دست آمده، پیکره ساخته شده قابلیت بسیار بالایی برای داده کاوی و استفاده در تمام پژوهش هایی که بر روی متون علمی انجام می شود را دارا است. با استفاده از این پیکره می توان توصیفی داده محور از نحوه کاربرد زبان توسط گروه های مختلف کاربران زبانی ارائه کرد. با بارگذاری این پیکره در سایت کتابخانه مرکزی دانشگاه فردوسی مشهد، امکان کاربری عام آن به زودی فراهم خواهد شد.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان