مطالب مرتبط با کلیدواژه

رسم‌الخط فارسی


۱.

مسائل‌ زبان‌ و خط فارسی‌ در ذخیره‌‌سازی و بازیابی‌ اطلاعات

نویسنده:

کلیدواژه‌ها: آموزش زبان فارسی بانکهای اطلاعاتی ذخیره و بازیابی اطلاعات رسم‌الخط فارسی

حوزه های تخصصی:
تعداد بازدید : ۱۷۶۸ تعداد دانلود : ۹۳۷
بانک‌های‌ اطلاعاتی‌ فارسی‌، پیش‌ از آن‌ که‌ فرهنگستان‌ زبان‌ معیارهای‌ لازم‌ را برای‌کاربرد اصطلاحات‌ علمی‌ و رسم‌الخط فارسی‌ تعیین‌ کند شکل‌ گرفتند. مجریان‌بانک‌های‌ اطلاعاتی‌ و نمایه‌سازان‌، خواسته‌ یا ناخواسته‌ ـ با مسائل‌ واژه‌ گزینی‌ و جنبه‌هایی‌ از زبانشناسی‌ درگیر شدند. در کار واژه‌ گزینی‌، اطلاع‌‌رسانان‌ ـ به‌ لحاظ ماهیت‌ حرفه‌خود ـ واژه‌های‌ رایج‌ در جامعه‌ تولیدکنندگان‌ و استفاده‌ کنندگان‌ از اطلاعات‌ را مد نظردارند و خود را مجاز به‌ واژه‌سازی‌ و اعمال‌ سلیقه‌ نمی‌دانند. واژه‌های‌ تازه‌ ساخت‌ نیز تازمانی‌ که‌ در جامعه‌ مقبولیت‌ لازم‌ را به‌ دست‌ نیاورده‌ باشند و در مدارک‌ به‌ کرات‌ دیده ‌نشوند، در نظام‌های‌ ذخیره‌ و بازیابی‌ اطلاعات‌ یا ظاهر نمی‌شوند و یا میهمان‌ چندروزه‌اند. بخش‌ قابل‌ توجهی‌ از مشکلات‌ نمایه‌‌سازان‌ از رواج‌ و کاربرد واژه‌ ناشی‌ می‌شود.متخصصان‌ برای‌ یک‌ مفهوم‌ واحد اصطلاحات‌ متفاوت‌ به‌ کار می‌برند. حتی‌ متخصصانی‌که‌ در یک‌ رشته‌ و در یک‌ جامعه‌ کوچک‌ کار می‌کنند خود را ملزم‌ به‌ هماهنگی‌ در کاربرد واژه‌های‌ تخصصی‌ نمی‌بینند. به‌ علاوه‌ برای‌ بسیاری‌ از اصطلاح‌های‌ وارداتی‌ معادل‌های ‌متفاوت‌ در زبان‌ فارسی‌ وجود دارد که‌ در مواردی‌ همه‌، کم‌ و بیش‌، به‌ یک‌ اندازه‌ کاربرد دارند. این‌ گونه‌ مطالب‌ به‌ علاوه‌ مسائل‌ رسم‌الخط فارسی‌، آوانویسی اسامی‌ عناصر وترکیبات‌ شیمیائی‌، سرواژه‌ها و کوته‌‌نوشته‌ها سبب‌ شده‌ است‌ تا ذخیره‌ اطلاعات‌ به‌ زبان‌فارسی‌ با کندی‌ صورت‌ گیرد و جستجو و بازیابی‌ کارایی‌ مطلوب‌ را نداشته‌ باشد. در این‌ مقاله‌ سعی‌ خواهد شد نمونه‌ هایی‌ از تجربه‌های‌ واژه‌ گزینی‌ در ذخیره ‌اطلاعات‌ ارائه‌ شود تا با‌ توجه‌ به‌ آنها، شاهد تسریع‌ و تسهیل‌ ذخیره‌ و بازیابی ‌اطلاعات‌ به‌ زبان‌ فارسی‌ باشیم‌.
۲.

روشی برای رفع چالش‌های محتواکاوی در وب‌های فارسی زبان

کلیدواژه‌ها: نمایه‌سازی رسم‌الخط فارسی انتولوژی نمایه‌سازی فارسی کاوش وب‌های فارسی وب‌کاوی نرم‌افزار خزنده محتواکاوی

حوزه های تخصصی:
تعداد بازدید : ۱۱۵۸ تعداد دانلود : ۶۸۴
زبان فارسی از دو منظر برای ما ایرانیان دارای اهمیت است. اول آن‌که این زبان با تاریخ و فرهنگ و تمدن ما پیوندی دیرینه و ناگسستنی دارد و دوم آن‌که زبان فارسی زبان رسمی کشور و ابزار مبادله اندیشه‌ها وایده‌ها در عرصه علمی و فرهنگی این مرز‌و‌‌بوم محسوب می‌گردد. رشد علمی و فنی و فرهنگی ما در گرو برقراری ارتباط زبانی و کلامی با دنیای الکترونیکی عرضه دانش و فرهنگ است که وب نام دارد و این میسر نیست جز با تقویت کیفی زبان فارسی مورد استفاده در این دهکده جهانی. اما زبان فارسی، در تلاقی با جهان الکترونیکی، بخصوص از بُعد رسم‌الخط، دارای دشواری‌هایی است که کاوش در محتویات آن را دچار کم‌کیفیتی می‌نماید. این مقوله مستلزم تمهیداتی چند است تا زبان فارسی را به زبانی مناسب برای پهنه الکترونیکی دادوستد دانش ـ وب ـ تبدیل نماید. مقاله حاضر تلاشی است درجهت مرتفع‌سازی چالش‌های کاوش در وب‌های فارسی‌زبان که از دیدگاه رسم‌الخطی، با استفاده از نمایه‌سازی فارسی و دیدگاه مفهومی، با استفاده از انتولوژی قابل بحث هستند.