۴.
کلیدواژهها:
خط فارسی ذخیره و بازیابی پایگاه های اطلاعاتی رسم الخط پیوسته نویسی جدانویسی
مقدمه: ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانه ای پدید آورده است. رسم الخط فارسی نیز از یک سو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، به هنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایه سازان پایگاه ها، کاربران و پدیدآورندگان منابع به وجود آورده است. روش بررسی: این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایان نامه های موجود رشته کتابداری و اطلاع رسانی به منزله نمونه ای از متون فارسی در پایگاه های اطلاعاتی پژوهشگاه های علوم و فناوری اطلاعات ایران و مرکز منطقه ای اطلاع رسانی علوم و فناوری و از هر پایگاه 50 عنوان به صورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاه ها، ارزیابی و مقایسه شد. یافته ها: نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شده اند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایان نامه ها، در مورد نحوه نگارش کلماتی که 2 جزئی و مشتق می باشند، دچار خطا شده اند. در پایگاه اطلاعاتی مرکز منطقه ای اطلاع رسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسم الخط همچنان بازیابی شدند. نتیجه گیری: این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقه ای اطلاع رسانی علوم و فناوری، در بازیابی عنوان پایان نامه ها در حالتهای مختلف پیوسته و جدا نوشته شده، بهتر عمل می کند. همچنین، باید به نویسندگان پایان نامه ها، استفاده از قواعد یکدست ملی بویژه در نگارش کلمات 2 جزئی و مشتق تأکید شود.