مطالب مرتبط با کلیدواژه

فیلترکردن


۱.

آزمایش‌هایی درباره تأثیر تحلیل گفتمان بر الگوریتم‌های رده‌بندی و بازیابی اطلاعات

کلیدواژه‌ها: الگوی گفتمان تحلیل بافتار زبان‌شناسی رایانه‌ای روش‌های تحلیل متن فیلترکردن کی – مینز ان –گرام‌ها هم- عبارت‌سازی[9]

حوزه های تخصصی:
تعداد بازدید : ۱۱۲۵ تعداد دانلود : ۵۹۲
پژوهشگران نظام‌های نمایه‌سازی و بازیابی، به‌منظور بهبود نتایج [جستجو]، همواره از گنجاندن اطلاعات بافتاری بیشتر، پشتیبانی کرده‌اند. افزایش شمار پایگاه‌های اطلاعاتی متن کامل و پیشرفت‌های به دست آمده در ظرفیت ذخیره‌سازی رایانه‌ای، تحلیل متن را با بهره‌گیری از دانش زبان‌شناسی و فرا- زبان‌شناسی امکان‌پذیر ساخته است. از میانه دهه 1980، پژوهشگران توجه و گرایش بیشتری به بافتار پیدا کرده‌اند، و تحلیل گفتمان نقش مهم‌تری یافته است. هدف پژوهش توصیف شده در این مقاله، بررسی این مسئله است که آیا متغیرهای گفتمان، بر الگوریتم‌های نوین بازیابی و رده‌بندی اطلاعات اثر می‌گذارند یا نه. به‌منظور ارزیابی این فرضیه، چارچوبی عملی برای تحلیل اطلاعات در محیطی خودکار پیشنهاد شده است. در این محیط، ان‌ـ گرام‌ها[4] (فیلترکردن) و  کی‌ـ مینز (میانگین عددkا) و الگوریتم‌های رده‌بندی  و چن با زیرمجموعه‌هایی از مدارک، برپایه متغیرهای گفتمانی «گونه»، «سیاق»، «اصطلاح‌شناسی حوزه» و «ساختار مدرک» مورد آزمون قرار گرفتند. نتایج حاصل از مطالعه الگوریتم‌های زیرمجموعه‌های مختلف، با ساختار اطلاعات « سرعنوان‌های موضوعی پزشکی» (مِش) مقایسه شد. این نتایج نشان می‌دهد که ان‌ـ گرام‌ها وابستگی واضحی به متغیرهای گفتمان ندارند؛ هرچند که الگوریتم رده‌بندی کی‌ـ مینز چنین وابستگی را، البته فقط در «اصطلاح‌شناسی حوزه» و «ساختار مدرک» نشان می‌دهد، و سرانجام این‌که «الگوریتم چن» وابستگی مشخصی به همه متغیرهای گفتمان دارد. از این اطلاعات می‌توان برای طراحی بهتر الگوریتم‌های رده‌بندی که باید متغیرهای گفتمان را مورد توجه قرار دهند، استفاده کرد. نتایج فرعی دیگری نیز از این پژوهش حاصل شده است که در مقاله ارائه می‌گردد.
۲.

تهیه مدل رقومی زمین مناطق جنگلی با استفاده از داده های لایدار هوایی - مطالعه موردی: درود، لرستان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: لایدار فیلترکردن شیب مبنا درون یابی عکس فاصله وزنی

حوزه های تخصصی:
تعداد بازدید : ۶۹۲ تعداد دانلود : ۶۵۶
مدل رقومی زمین برای پردازش اطلاعات مکانی یک مؤلفه اصلی محسوب می شود و در علوم زمین کاربردهای فراوانی دارد. برای تولید مدل رقومی زمین از داده های لایدار بایستی نقاطی که متعلق به عوارض غیرزمینی هستند از مجموعه داده ها حذف شوند و سپس با روشی مناسب اقدام به درون یابی نقاط زمینی شود تا مدل رقومی زمین بصورت یک شبکه رستر با ابعاد مناسب از این نقاط تولید گردد. در تحقیق حاضر برای تولید مدل رقومی زمین از داده های لایدار در بخشی از مناطق جنگلی شهرستان درود، ابتدا فیلتر مورفولوژیک شیب مبنا برای جداسازی نقاط مربوط به پوشش جنگلی (نقاط مربوط به عوارض غیرزمینی) استفاده شد و آستانه شیب مناسب برای فیلتر شیب مبنا تعیین گردید. این فیلتر بر پایه مفاهیم مورفولوژیک ریاضی طراحی شده است. الگوریتم فیلترینگ شیب مبنا دو پارامتر ورودی شعاع همسایگی و آستانه شیب دارد. پس از اجرای الگوریتم شیب مبنا بر ابر نقاط لایدار برای اطمینان از دقت فیلترکردن داده ها، بخشی از ابر نقاط منطقه (5 درصد سطح منطقه) انتخاب و نقاط آن بصورت دستی فیلتر شد. نتایج فیلتر دستی با نتایج فیلترکردن شیب مبنا (با در نظر گرفتن آستانه شیب های مختلف) مقایسه شد. آستانه شیب های پیشنهادی براساس شرایط منطقه انتخاب شدند و در نهایت بهترین آستانه شیب برای فیلترینگ داده ها انتخاب گردید. سپس دو روش   عکس فاصله وزنی و کریجینگ برای درون یابی و تولید مدل رقومی زمین بکار گرفته شدند. نتایج نشان داد شیب 44 درجه بهترین آستانه برای جداسازی نقاط عوارض غیرزمینی از زمینی است و روش عکس فاصله وزنی با توان سوم با ضریب همبستگی 9986/0و خطای 204/0 متر دقیق ترین روش برای درون یابی و تولید مدل رقومی زمین در منطقه مورد مطالعه است.