مقایسه روش های تخصیص وزن های بهینه به مؤلفه های آزمون های مرکب (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
یک مسئله مهم در تعیین نمره یک آزمون مرکب، نحوه ترکیب نمره بخش های مختلف آزمون یا اصطلاحاً خرده آزمون ها به منظور محاسبه نمره کل داوطلبان است. این وزن ها باید به گونه ای انتخاب شوند که ضمن در نظر گرفتن ویژگی های روان سنجی هر خرده آزمون و مؤلفه های تعیین کننده آنها، اختلاف نمره مشاهده شده هر داوطلب با نمره واقعی که بیانگر توانایی واقعی داوطلب است را حداقل نماید. به عبارت دیگر چارچوب تصمیم گیری بر مبنای ملاحظات مختلف نظیر روایی محتوا (اعتبار)، دفعات آزمون، پایایی و ... طراحی می شود. برای به دست آوردن حداکثر پایایی در نمره مرکب روش های مختلفی در چند دهه اخیر پیشنهاد شده است. این روش ها به دو دسته کلی، روش های ضمنی و عینی تقسیم می شوند. روش های ضمنی شامل جمع کردن نمرات خام و مدل بندی سئوال- پاسخ و روش های عینی شامل وزنی کردن مؤلفه ها به وسیله میزان دشواری سئوالات، تخصیص وزن ها به نمرات مؤلفه ها بر مبنای ماکسیمم اندازه پایایی، و وزنی کردن مؤلفه ها بر اساس ماکسیمم کردن روایی نمرات مرکب است. در این مقاله، رویکرد به دست آوردن حداکثر پایایی را در دو نظریه کلاسیک آزمون سازی و نظریه سئوال- پاسخ معرفی و ضمن بیان نقاط ضعف و قوت هر روش، برآورد پایایی نمره مرکب و خطای استاندارد اندازه گیری در این روش ها برای داده های شبیه سازی شده بررسی خواهیم کردComparing the Methods of Assigning Optimum Weights to the Components of Composite Tests
An important issue in obtaining the score in a composite test is the status of combining to combine different component scores of the test to compute the total scores of examinees. These weights should be selected in a manner that not only considers the psychometric properties of each component and their determining elements, but also minimizes the difference between the observed score and the real score of each examinee which explains his/her real ability. In other words, the framework of decision-making is designed with respect to different considerations such as validity, test times, reliability, etc.
There have been suggestions for obtaining to obtain the maximum reliability of composite scores in the last few decades. These include the implicit approach and the explicit approach. The implicit approach involves adding the raw scores and using IRT model. The explicit approach involves weighting the components by the difficulty of the items, assigning the weights to component scores based on the reliability measures of the components, and weighting the components by maximizing the validity of the composite scores. In this paper, we introduce the approach of obtaining the maximum reliability in Classical Test Theory and Item Response Theory. Besides considering the pros and cons of each method, we investigate the estimates of the reliability and the standard error of measurement of the composite scores for data in a simulation study