آرشیو

آرشیو شماره ها:
۱۱۷

چکیده

با توجه به حجم عظیم داده های جمع آوری شده در سازمان ها و سیستم های نگهداشت و مدیریت اطلاعات که سبب شکل گیری انبار داده های بسیار بزرگ شده، نیاز به استخراج الگو از متون هر روز بیشتر احساس می شود. متن کاوی یکی از مهم ترین روش ها در استخراج الگوی مناسب است که به وسیله اقتباس یا استخراج دانش از مجموعه ای از داده ها به اهداف سازمان ها بسیار کمک می کند. این روش ها همچنین می توانند افق جدیدی را برای تجارت و حفاظت از مالکیت معنوی آثار نویسندگان به وجود آورند. در این مقاله با رویکردی جدید به کشف الگوهای متنی جهت سازماندهی و تجزیه و تحلیل هوشمند متن می پردازیم. هدف اصلی، به کارگیری الگوی مناسب در جهت حفظ آثار نویسندگان، محققان و اسناد متنی است. با توجه به حجم آثار نویسندگان و سیستم های مدیریت اسناد، حجم اطلاعات در دسترس نیز به شدت افزایش یافته است. برای کشف دانش موجود در این داده ها، که منفعت زیادی را برای کاربران اطلاعات به دنبال دارد، روش های خاصی مورد نیاز است که در حوزه داده کاوی به آن پرداخته شده است. بخش اعظم این داده های در دسترس به صورت متنی و بدون ساختار یا نیمه ساختارمند هستند که برای استفاده از آن ها می توان علاوه بر روش های مورد استفاده در داده کاوی، از فناوری هایی مانند پردازش زبان طبیعی، تجزیه و تحلیل هوشمند و علم آمار بهره گرفت.

تبلیغات