تحلیلی بر پیکره حاصل از داده های زبانی فارسی در فضای مجازی(مقاله علمی وزارت علوم)
منبع:
زبان و زبان شناسی دوره ۱۹ پاییز و زمستان ۱۴۰۲ شماره ۳۷
117 - 136
حوزه های تخصصی:
امروزه وجود ابزارهای ارتباطی نوظهور سبب شده است که ارتباط میان گویشوران ازطریق نوشتن میسر شود. ماهیت الکترونیکی، جهانی و تعاملی این دسته از فناوری های نوظهور سبب تسهیل و افزایش سرعت در ارتباطات شده است. تعامل زبانی با به کارگیری این ابزارها و رابطه میان گفتار و نوشتار سبب می شود که گونه ای از نوشتار توسط کاربران یک زبان خلق شود، گونه ای که به نونویسی معروف است. هدف از انجام این پژوهش بررسی ویژگی های نونویسی در فارسی و طبقه بندی انواع آن براساس پیکره زبانی تهیه شده از داده های منتشرشده در شبکه های اجتماعی است. برای این هدف، داده های گردآوری شده در این پیکره براساس شیوه نگارش معیارشان، در سطوح آوایی، بن واژه ای و مقوله دستوری به صورت نیمه خودکار برچسب گذاری شده است. سپس واژه هایی که صورت نوشتاری شان متفاوت از صورت معیار است و دارای نوعی نونویسی است ازجنبه ویژگی های خط و همچنین ویژگی های زبانشناختی مورد بررسی قرار گرفت. نتایج حاصل از تحلیل این داده ها و برچسب هایشان نشان می دهد که نونویسی در فارسی در فضای مجازی در دو سطح نگارشی و آوایی-ساخت واژی اتفاق می افتد و واژه های محتوایی بیشترین میزان نونویسی واژه ها را متحمل می شود.