سنجش انطباقی با رایانه
آرشیو
چکیده
منطبق کردن دشواری سئوال با سطح ویژگی آزمودنی، کارآترین روش اندازه گیری یک ویژگی است. برای این منظور به آزمودنی ها، سئوال هایی ارائه می شود که اطلاعات دقیقی در باره میزان و سطح ویژگی آنها، بدست آید. این موضوع اندیشه زیربنایی سنجش انطباقی است و از یافته ها و نتایج مدل های نظریه سئوال- پاسخ، در تحلیل سئوال های آزمون، متأثر است. سنجش انطباقی از نتایج طبیعی تفکر به شیوه بیز در برآورد و بررسی تابع آگاهی سئوال آزمون است، و دارای دلالت های ضمنی برای برای تفسیر و تهیه آزمون است. این شیوه دارای تقریب های ساده و متنوعی است. سنجش انطباقی با رایانه (سار)، یک روش پیچیده تر سنجش انطباقی است. اجرای برنامه سار تکرار فرآیندی دو مرحله ای است که در گام نخست، سئوالی به آزمودنی عرضه می شود که دشواری آن با توانایی فعلی برآورد شده برای او برابر باشد. در گام دوم، توانایی آزمودنی براساس اطلاعات حاصل از پاسخ او به سئوال مرحله اول، برآورد می شود. این گام ها تکرار می شوند تا جایی که ملاک های پایان دادن به آزمون محقق شوند. برنامه ریزی واقعی، اجرای عملی و حفاظت برنامه سار ساده نیست. چالش های عملی و پیچیدگی های برنامه سار شامل: خزانه های سئوال، حفاظت آزمون، و مسائل مربوط به آزمودنی ها.Computerized Adaptive Testing
Adaption of the item difficulty level to the subject's characteristics is the most efficient method in characteristics testing. To achieve this goal, a number of items were presented to the subjects to gain an exact understanding of their levels. The above mentioned issue comprises the fundamental idea underlying the adaptive testing which is influenced by the outcomes of the item-response theory in the analysis of a test questions. Adaptive testing is the natural result of Bayesian thinking method in estimating and analyzing the information function of the items and includes some inferences for the preparation and interpretation of the test. This method includes a number of simple and yet various approximations. A more complex method of adaptive testing is the Computerized Adaptive Testing (CAT), which includes a two stage process. In the first stage, an item will be presented to the subjects with the same difficulty level as their current abilities. Then, their abilities will be measured on the basis of their responses to the item of the first stage. These stages are repeated over and over to make the ultimate decision to end the test. Real planning, practical application, and CAT protection demand hard work including: item pools, test security, and examinee issues