بررسی مشکلات جستوجو و بازیابی اطلاعات در پایگاههای اطلاعاتی از جنبه ویژگیهای نگارشی زبان فارسی (مقاله علمی وزارت علوم)

درجه علمی: نشریه علمی (وزارت علوم)

درجه علمی در دسته‌بندی سابق وزارت علوم: علمی-پژوهشی

نویسندگان: هدی هماوندی یعقوب نوروزی ملوک السادات حسینی بهشتی

منبع: پژوهشنامه پردازش و مدیریت اطلاعات دوره 33 بهار 1397 شماره 3 (پیاپی 93)

کلید واژه ها: بازیابی اطلاعات پایگاه‌های اطلاعاتی زبان فارسی ویژگیهای نگارشی

حوزه های تخصصی:

حوزه‌های تخصصی علم اطلاعات و دانش‌شناسی

شماره صفحات: ۱۰۸۷-۱۱۱۰

دریافت مقاله تعداد دانلود : ۵۰۰

آرشیو

چکیده

این پژوهش با هدف تشریح مشکلات عمده نوشتاری و معنایی زبان فارسی در استفاده از محیط های اطلاعاتی و تعیین میزان انطباق و توجه به این ویژگی ها هنگام جست وجو و بازیابی در پایگاه های اطلاعاتی فارسی و به روش پیمایشی-تحلیلی و با استفاده از شیوه مشاهده مستقیم انجام گرفت. پس از مرور پژوهش های مرتبط، کلیدواژه های کاوش در قالب یک سیاهه شکل گرفت. هر یک از این کلیدواژه ها در پایگاه های اطلاعاتی مورد مطالعه شامل «پژوهشگاه علوم و فناوری اطلاعات ایران»، «پایگاه استنادی علوم جهان اسلام»، «پایگاه مجلات تخصصی نور» و «پایگاه اطلاعات علمی جهاد دانشگاهی» جست وجو و تعداد نتایج بازیابی شده ثبت گردید. سپس، به بررسی میزان انطباق پایگاه های اطلاعاتی با این ویژگی ها پرداخته شد. برخی ویژگی های نوشتاری و معنایی زبان فارسی سبب بروز مشکلاتی در بازیابی اطلاعات از پایگاه های اطلاعاتی منتخب می شوند. مواردی مانند پیوسته نویسی و جدانویسی واژگان مشتق، مرکب و مشتق- مرکب، گوناگونی جمع ها، واژگان دخیل و معادل آن ها در بخش نوشتاری و چندمعنایی، همنامی و ... در بخش معنایی از این دست ویژگی ها هستند. فقدان پوشش مناسب ویژگی های یادشده در مراحل ذخیره سازی و پردازش و عدم آگاه نمودن کاربر از آن جهت اصلاح فرایند کاوش در مرحله بازیابی اطلاعات در پایگاه های اطلاعاتی مورد پژوهش، اثرات نامطلوبی بر فرایند کاوش و بازیابی دارد. یافته ها نشان داد که پایگاه های اطلاعاتی فارسی نسبت به ویژگی های نوشتاری و معنایی زبان فارسی توجه کافی نداشته و بسیاری از ویژگی های آن را در مراحل ذخیره سازی و پردازش اطلاعات نادیده می گیرند. با توجه به تأثیر این ویژگی ها در تعامل کاربران با پایگاه های اطلاعاتی، احتیاج کاربران فارسی زبان به ابزارهای کاوش بومی و پایگاه های اطلاعاتی که مبتنی بر ویژگی های زبانیِ خودشان طراحی شده باشد، بیش از پیش احساس می شود. پژوهش حاضر با بررسی میزان توانایی پایگاه های اطلاعاتی فارسی زبان در پوشش برخی ویژگی های این زبان که در فرایند جست وجو و بازیابی تأثیر قابل توجهی دارند، نقاط ضعف و قوت این پایگاه ها را مشخص نموده است. نتایج آن می تواند در جهت بهبود و اصلاح عملکرد پایگاه های مذکور مورد استفاده قرار گیرد.