پیکره متون زبان طبیعی(طراحی، ساخت و مدیریت)(مقاله علمی وزارت علوم)
حوزههای تخصصی:
با توجه به نقش پیکرهها در حوزههای مطالعاتی گوناگون و لزوم ساخت یک پیکره عمومی برای افزایش کارایی و اثربخشی در پردازشهایی که مستلزم بهرهجویی و استفاده از متن زبان طبیعی است، هدف این مطالعه تمرکز بر طراحی و ساخت خودکار پیکره متون زبان طبیعی و نرمافزاری برای مدیریت آن است. در این پژوهش از روش مبتنی بر فناوری برای ساخت پیکره تک-زبانه و به زبان فارسی استفاده شده است. این پیکره بهصورت خودکار و با گردآوری دادههای وبی تولیده شده و منابع آن را متون خبری مندرج در خبرگزاریهای فارسیزبان تشکیل داده است. در این مطالعه پیکرهای از متون زبان طبیعی به زبان فارسی ساخته شده است. با توجه به خودکار بودن فرایند ساخت پیکره، نرمافزاری برای مدیریت آن، چه در مرحله ساخت و چه در مرحله استخراج اطلاعات نیاز است که در این مطالعه طراحی، ساخته و پیادهسازی شده است. ساخت پیکرهای عمومی از متون زبان طبیعی، برای اهداف پژوهشی گوناگون کاربرد دارد و روش پیشنهادی و استفاده از ابزارهای معرفیشده در این مطالعه میتواند ساخت پیکره را تسهیل کند. همچنین طراحی نرمافزاری برای مدیریت پیکره، صرفهجویی در زمان و هزینه ساخت را به همراه خواهد داشت و امکان استخراج اطلاعات از آن را فراهم خواهد آوُرد.