داده های گمشده در آزمون های سراسری ورود به دانشگاه: مبانی نظری و شواهد مبتنی بر داده های واقعی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
داده های گمشده پدیده رایج مطالعات تجربی و سنجش های آموزشی و روان شناسی هستند که به هرگونه بدون پاسخ ماندن سؤال اطلاق می شود. روش های آماری بسیاری برای محاسبات مجموعه داده های دارای پاسخ گمشده وجود دارد که تحت تأثیر مکانیسم گمشدگی، علل و میزان آنها هستند. هدف از نگارش این مقاله، بررسی وضعیت موجود داده های گمشده در آزمون سراسری ورودی دانشگاه هاست. با استفاده از روش های آمار توصیفی و نرم افزارهای SPSS و R نشان داده شد میزان داده های گمشده در سال های مورد بررسی افزایش یافته است (در دامنه ای بین 2.2% تا 91.6%) و شاخص های آماری آزمون تحت تأثیر میزان داده های گمشده قرار دارد. همچنین نشان داده شد همبستگی مثبت و بالایی بین تعداد پرسش های بدون پاسخ در درس های مختلف (r=0.41, 0.78)؛ و همبستگی منفی و بالایی بین تعداد پاسخ های درست و تعداد پاسخ های گمشده (r=-0.56, -0.85) وجود دارد. نتایج به دست آمده از این مقاله، نشان از ثبات رخداد داده های گمشده در ابعاد مختلف شایستگی و غیرقابل اغماض بودن داده های گمشده در تحلیل های آماری دارد.Missing Data in University Entrance Exams: Theoretical Bases and Evidence Based on Real Data
Missing data that refer to any non-answering to items is a common phenomenon of empirical studies, educational and psychological assessments. Different statistical methods for dealing with nonresponse data are affected by the mechanism of missing-ness, their causes and their extent. The purpose of this article is exploring and describing the missing data in the university entrance national exam. Data for General Persian Literature Test of mathematical, Empirical and humanity Science fields and professional tests including literature in humanity filed, biology in empirical field and mathematics in math field in 1383, 1391 and 1395 (Solar years) used for this purpose. Analysis was done by SPSS, R and ‘psych’ package in R. It is shown the amount of missing data has increased in the years under review (min 2.2% and max 91.6%). Under amusingness condition item difficulties are overestimated. It is also shown that there is a high positive correlation between the number of non-answered items in different test of the same year (rmin = 0.41 and rmax=0.78); and the high negative correlation between the number of correct responses and missing answers (rmin = -0.56 and rmax =-0.85). The results of show occurrence of missing data in various competence dimensions and non-ignorable of missing data in statistical analyzes. It is necessary to select and use appropriate method for missing data when analyzing data for university entrance national exam.