امکانات و کاستی های ستاک یابی فارسی در پردازش زبان طبیعی(مقاله علمی وزارت علوم)
حوزههای تخصصی:
برای سرعت بخشیدن و آسانی انتقال و گسترش دانش، فرایندهای ذخیره و مبادله اطلاعات خودکارسازی می شوند. پردازش زبان طبیعی از محورهای این خودکارسازی است. زبان شناسان نظری می توانند در پیشبرد مطالعات پردازش زبان طبیعی نقش تأثیرگذاری ایفا کنند. آن ها باتکیه بر دستاوردهای مطالعات زبان شناختی می توانند با شناسایی شباهت های زبان ها به یکدیگر ابزاری را که متخصصان پردازش زبان طبیعی برای زبانی مشخص طراحی کرده اند، براساس شباهت برای زبان دیگری پیشنهاد دهند. به عبارتی، زبان شناسان نظری می توانند به تعمیم نتایج پژوهش های پردازش زبان طبیعی کمک کنند. در این مقاله، رویکردهای ستاک یابی زبان فارسی ازمنظر زبان شناسی نظری مطالعه و تحلیل شده اند. تحلیل صرفی از مراحل پردازش زبان طبیعی است که به صورت کلمه می پردازد. ستاک یابی نیز از مراحل اصلی تحلیل صرفی است که بر کاهش صورت واژه تصریف شده یا واژه مشتق تا رسیدن به ریشه یا ستاک تمرکز دارد. ازنظر زبانی، غنای صرفی، مسائل خط فارسی و منابع محدود باعث شده اند ستاک یابی در زبان فارسی به پژوهشی دشوار تبدیل شود. پیمودن این مراحل دشوار در گرو طراحی روش هایی کارآمد برای مؤلفه های خاص زبان فارسی است. پس از تحلیل رویکردهای مختلف ستاک یابی همچون رویکردهای ساختاری، آماری و یادگیری عمیق برای زبان هایی با مسائل مشابه مسائل زبان فارسی، ستاک یابی با استفاده از الگوی دنباله به دنباله برای زبان فارسی پیشنهاد می شود.