مطالب مرتبط با کلیدواژه

واژه های بازدارنده


۱.

شناسایی واژه ها ی غیر مفهومی (رایج) در نمایه سازی خودکار مدارک فارسی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نمایه سازی خودکار واژه های غیرمفهومی واژه های بازدارنده ساخت واژگانی زبان فارسی

حوزه های تخصصی:
  1. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم کتابداری نمایه سازی و چکیده نویسی
  2. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات سازماندهی اطلاعات
  3. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات ذخیره و بازیابی اطلاعات
تعداد بازدید : ۱۶۵۱ تعداد دانلود : ۸۶۷
پژوهش حاضر با هدف شناسایی واژه­های غیرمفهومی در زبان فارسی و تهیه سیاهه­ای از این واژه­ها برای نمایه­سازی خودکار متنهای فارسی در رشته­های روانشناسی، علوم­تربیتی و کتابداری و اطلاع­رسانی انجام شده است. این پژوهش با روش تحلیل محتوا صورت گرفته­است. جامعه آماری این پژوهش را مقاله های مندرج در آخرین شماره منتشر­شده در مجله های علمی و پژوهشی ِ رشته­های علـوم­تربیتی، روانشناسی و کتابداری و اطلاع­رسانی در سال 1385 تشکیل میدهد. نمونه شامل 63 مقاله است. گردآوری داده­ها با استفاده از تفکیک واژگان به صورت ماشینی و دستی صورت گرفت. نتایج پژوهش نشان داد: 1- افعال ( معین و همراه­شونده)، قیدها، ضمایر، حروف، اصوات، اعداد و علائم سجاوندی به­عنوان واژه نمایه­ها ظاهر نمی­شوند، بنابراین، آنها را می­توان واژه­های غیرمفهومی یا به اصطلاح واژه­های بازدارنده تلقی کرد. 2- بدون احتساب علائم سجاوندی، در رشتة علوم تربیتی 96/39%، در رشته روانشناسی 57/38% و در رشـــته کتابداری 12/38% از حجم متون را واژه­های غیرمفهومی تشکیل می­دهد. 3- واژه­های بازدارندة پربسامد در هرسه حوزه تقریبا مشابه است. 4- از تعداد 248552 واژه (بدون احتساب علائم سجاوندی) که پیکرة زبانی مورد مطالعه را تشکیل می­داد، 97280 واژه که 94/38% کل واژه ها را شامل می­شود، جزء واژه­های بازدارنده هستند.5- نتیجة مقایسه فهرست فارسی حاصل از پژوهش با فهرست واژه­های بازدارنده انگلیسی نشان داد بین این دو فهرست به میزان 5/28% همپوشانی وجود دارد. 6. همچنین 38/20% از واژه­ها فاقد توزیع بسامدی یکسان در سه رشتة مورد مطالعه می­باشند
۲.

کاربرد و تعدیل قانون زیف و الگوی آماری زو در بازشناسی واژه های بازدارنده زبان فارسی با استفاده از خوشه زبانی مقالات علمی- پژوهشی رشته کتابداری و اطلاع رسانی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: نمایه سازی خودکار واژه های بازدارنده قانون زیف بسامد واژگانی الگوی آماری زو

حوزه های تخصصی:
  1. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم کتابداری پژوهش های کتابداری،روش پژوهش در کتابداری
  2. حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی علوم کتابداری نمایه سازی و چکیده نویسی
تعداد بازدید : ۹۸۸ تعداد دانلود : ۵۵۰
هدف: شناسایی و استخراج سیاهه هایی نظام مند از واژه های بازدارنده به منظور استفاده در نمایه سازی خودکار متن های فارسی رشته کتابداری و اطلاع رسانی روش: روش تحلیل محتوا است. جامعه پژوهش، 56 مقاله بودند که 20 مقاله با روش نمونه گیری تصادفی ساده انتخاب شدند. یافته ها: از مجموع 15557 واژه موجود در متن مقالات، مطابق با الگوی زو، قبل از تعدیل واژه ها، 1368 و بعد از تعدیل، 468 واژه؛ مطابق قانون زیف نیز قبل از تعدیل، 217 و بعد از تعدیل، 607 واژه به عنوان واژه بازدارنده شناخته شدند. هم چنین از مجموع 1989 واژه موجود در چکیده مقالات، مطابق با الگوی زو قبل از تعدیل واژه ها، 148 و بعد از تعدیل، 173 واژه و بر اساس قانون زیف، قبل از تعدیل60 و بعد از تعدیل، 186 واژه به عنوان واژه بازدارنده استخراج شدند. در هر دو روش رابطه مستقیمی بین بسامد واژه ها و احتمال بازدارنده بودن آن ها مشاهده شد. بالاترین درصد واژه های بازدارنده (44/39 درصد) بدون احتساب بسامد، در متن مقالات و با کاربرد الگوی آماری زو به دست آمد. نتایج این پژوهش به افزایش کارایی، کاهش حجم فایل درونداد و صرفه جویی در زمان و هزینه ذخیره و بازیابی اطلاعات منجر می شود.