فیلترهای جستجو:
فیلتری انتخاب نشده است.
نمایش ۱٬۲۸۱ تا ۱٬۳۰۰ مورد از کل ۱٬۵۲۳ مورد.
مدل دو مرحله ای شکاف- گلچین برای نمایه سازی خودکار متون فارسی(مقاله علمی وزارت علوم)
حوزههای تخصصی:
هدف: به علت خاص بودن برخی از مسائل زبانی، لازم است که مدل های بومی نمایه سازی خودکار را با توجه به ویژگی های هر زبان طراحی کرد. این مدل ها باید به گونه ای طراحی شود که جامعیت و مانعیت نمایه سازی مورد توجه باشد. هدف این مقاله معرفی و سنجش توانمندی مدل دو مرحله ای شکاف – گلچین برای نمایه سازی خودکار مقالات فارسی است. ابتدا الگوریتم کار به تفصیل توضیح داده می شود و سپس همخوانی نتایج حاصل از این الگوریتم با کلیدواژه های نویسنده سنجیده خواهد شد. روش: مدل نمایه سازی خودکار فارسی به همراه توضیح مراحل و مسائل مرتبط با آن معرفی خواهد شد. ارزیابی مدل از طریق شاخص دربردارندگی انجام می شود که برای تعیین درصد همخوانی بین نمایه سازان مورد استفاده قرار می گیرد. برای این کار، میزان همخوانی اصطلاحات نمایه ای که از پیاده سازی الگوریتم این مدل حاصل شده اند، با کلیدواژه های نویسندگان مقالات بررسی می گردد. یافته ها: یافته ها نشان داد که در 90 درصد از موارد، اصطلاحی که این مدل در یک مقاله به عنوان پروزن ترین اصطلاح تشخیص داده است، مشابه اولین کلیدواژه نویسنده آن مقاله است. در کل، بین نتایج این مدل و کلیدواژه های نویسندگان 76 درصد همخوانی وجود داشت که در مقایسه با کارهای قبلی، قابل قبول به نظر می رسد. اصالت/ارزش: ارزش اولیه این کار پرداختن به نمایه سازی خودکار با توجه به ویژگی های زبان فارسی است. برای پیاده سازی مدل ارائه شده، فرض بر استفاده از زبان عبارات الگودار است که توسط بسیاری از زبان های برنامه نویسی پشتیبانی می شود و نیاز به نصب و استفاده از جدول های بانک اطلاعاتی را برای پردازش متن کاهش می دهد. همچنین، مشکل تعیین آستانه بالایی اصطلاحات اصلی را حل می کند. علاوه بر آن، با الگوریتمی خاص، حد پایینی را نیز تعیین می کند؛ به گونه ای که دیگر تعداد اصطلاحات گلچین شده به طول متن بستگی ندارد. این امکان، جامعیت و مانعیت نمایه سازی را تضمین می کند.
صحت ساختار ظاهری داده ها در پیشینه های کتابشناختی اپک کتابخانه ملی ایران(مقاله علمی وزارت علوم)
حوزههای تخصصی:
هدف: سنجش میزان صحت پیشینه های کتابشناختی پایگاه اپک کتابخانه ملی ایران به لحاظ ساختار صوری پیشینه ها.
روش/رویکرد پژوهش: در این پیمایش با بهره گیری از فرمول کوکران تعداد 1100 پیشینه از میان نزدیک به هفتصد هزار پیشینه کتاب انتخاب و با استفاده از سیاهه وارسی پژوهشگرساخته تحلیل شد.
یافته ها: در 48 درصدِ پیشینه ها اشکال وجود داشت. بیشترین اشکال رعایت نکردن ضوابط مربوط به یونی کد و غلط املایی در برخی عناصر اطلاعاتی بوده و کمترین اشکال به رده بندی و فهرست نویسی توصیفی تعلق داشته است. توزیع اشکالات در رده های مختلف نشان داد رده N دارای بیشترین اشکال و رده C دارای کمترین اشکال بوده است.
نتیجه گیری: برخی اشکالات نه به سبب ضعف در فهرست نویسی بلکه به دلیل شتاب زدگی در ورود اطلاعات رخ می دهند.
یادداشت
تاثیر اختلاف املایی انگلیسی آمریکایی و بریتانیایی بر میزان جامعیت
حوزههای تخصصی:
انگلیسی امریکایی و بریتانیایی ، دو گونه اصلی زبان انگلیسی ، افزون بر تشابهات فراوان در مواردی هم با هم اختلاف دارند . در این بین ، اختلاف املایی میتواند زمینه ساز کاهش جامعیت به هنگام بازیابی از پایگاه های اطلاع رسانی انگلیسی - فارسی گردد . در مقاله حاضر سعی شده است همراه با ارائه موارد موجود و تاثیر آن بر ضریب جامعیت ، راهکارهای احتمالی برای رفع این مسئله پیشنهاد شود...
با نقطه یا بی نقطه ؟: اشتباهی متداول در فهرستنویسی انتشارات ایرانی
منبع:
کتاب پاییز ۱۳۷۵ شماره ۲۷
حوزههای تخصصی:
نوشت افزارها
دوگان سازی کامل در زبان فارسی: بررسی پیکره بنیاد(مقاله علمی وزارت علوم)
حوزههای تخصصی:
فرایند تکرار یکی از فرایند های صرفی زایا ست که درباره ی آن در زبانهای مختلف و در چهار چوب نظریات مختلف زبانشناختی (دستور زایشی ، نظریه بهینگی و برنامه کمینگی ) مطالعات جامعی صورت گرفته است.اکنون با رشد زبانشناسی پیکره ای و مطالعات پیکره بنیاد می توان پژوهش های صرفی از این دست را دقیق تر به سامان رساند. تکرار در دونوع کامل و ناقص از سوی زبانشناسان (شقاقی 1389، هسپلمت 2002 و بائر 2003) بررسی شده است. تکرار کامل به معنای تکرار کامل یک پایه موسوم به جزء دو گانی است و تکرار ناقص به معنای افزودن جزئی به آغاز یا پایان یکی از پایه هاست. در این مقاله نوع کامل این فرایند زایای صرفی رادر زبان فارسی مورد بررسی قرار داده ایم تا به معانی و ساختار های غالب حاصل از آن و ویژگی های معنایی جزء دوگانی دست یابیم. برای دستیابی به این ویژگی ها به کمک زبانشناسی پیکره ای به پیکره ای جامع و قابل قبول در زبان فارسی نیاز بود که برای برای پژوهش حاضر لغتنامه متوسط دهخدا انتخاب شد. نخست کلیه ی دوگانی های کامل موجود در فرهنگ متوسط دهخدا به همراه توضیحات مربوط به ساخت آنها و معانی اشان استخراج شدند. تعداد دوگانی ها ی استخراج شده 299 مورد بود و آنگاه این داده ها بر اساس ساختار ، معنا و ویژگی های جزء دوگانی دسته بندی شدند. پس از بررسی معانی و ساختار ها نتایج جالبی به دست آمد. نتایج حاصل از بررسی و طبقه بندی داده ها نشان می دهند که به غیر از اصوات ساخت غالب در دوگان سازی ها قید است و به لحاظ معنا ، معنای غالب معنای قلت است و درصد غالب ساختها از عناصر معنا دار تشکیل شده اند. دیگر آنکه حتی اجزاء بی معنا نیز در ایجاد ساخت دو گانی شرکت کرده اند و در موارد متعددی معنای ساخت حاصل ربطی به معنای اجزاء دو گانی ندارد و معنایی کاملا جدید و متفاوت ایجاد شده است. در این میان تعداد نام آواها یا اصوات یک سوم ساختهارا تشکیل می دهند که حتی اصوات نیز نوعی معنا از خود ارائه می دهند و همه ی آنها فاقد معنا نیستند.نتایج حاصل از این پژوهش پیکره بنیاد در آموزش زبان فارسی ، تهیه پیکره های دوزبانه و نیز تسهیل فرایند ترجمه ماشینی کار آمد باشد و نخستین حاصل آن پیکره ای نسبتا جامع از دو گانی های کامل در زبان فارسی است که در شبکه های واژگانی بسیار کار آمد است.
مقایسه MCQ با JIF2 و JIF5 برای مجلات ریاضی(مقاله علمی وزارت علوم)
حوزههای تخصصی:
- حوزههای تخصصی علم اطلاعات و دانششناسی کتابخانه ها مجموعه های کتابخانه ای و منابع کتابخانه ای و اطلاعاتی انواع منابع اطلاعاتی نشریات
- حوزههای تخصصی علم اطلاعات و دانششناسی علوم کتابداری نمایه سازی و چکیده نویسی
- حوزههای تخصصی علم اطلاعات و دانششناسی علوم اطلاع رسانی خدمات اطلاع رسانی مدیریت اطلاعات
عنوان ابزار « ام سی کیو » چکیده: هدف این مقاله مقایسه ضریب استناد ریاضیات در دو بخش « جی آی اف » استنادسنجی موضوعی ریاضی با ضریب تأثیر مجلات ضریب تأثیر 2 ساله و 5 ساله است. مقایسه هم پوشانی نسبی نشان م ی دهد که درصد معادل « جی سی آر » در مجلات « آر ال جی » هم پوشانی نسبی مجلات فهرست مرجع « ام سی کیو » 72/2 درصد است. همچنین، مقایسه میانگین ضریب تأثیر مجلات فهرست به دو شکل کلی و دهک بندی شده نشان می دهد « جی آی اف 5 » و « جی آی اف 2 » با همواره « جی آی اف 5 » و « جی آی اف 2 » که میانگین ضریب تأثیر مجلات در فهرست است . مقایسه ضریب « ام سی کیو » بیشتر از میانگین ضریب تأثیر مجلات فهرست همبستگی کلی و دهک بندی شده نیز حاکی از این است که میزان همبستگی کل قوی و مستقیم بوده، اما « جی آی اف 5 » و « جی آی اف 2 » با « ام سی کیو » ضریب تأثیر همین شاخص با دهک بندی مجلات تغییر می کند و نشان می دهد که ضریب همبستگی در بسیاری از دهک ها به طرز محسوسی « جی آی اف 5 » و « جی آی اف 2 » با « ام سی کیو » تغییر کرده و حتی منفی نیز می شود.
تجدیدنظر در اصول و قواعد فهرست ن.یسی انگلو - امریکن
حوزههای تخصصی: