مطالعات اندازه گیری و ارزشیابی آموزشی
مطالعات اندازه گیری و ارزشیابی آموزشی سال 13 تابستان 1402 شماره 42 (مقاله علمی وزارت علوم)
مقالات
حوزه های تخصصی:
هدف: امروزه سنجش شناختی تشخیصی برای کسب اطلاعات بیشتر در مورد یادگیری آزمودنی ها مورد توجه قرار گرفته است. در همین راستا، در مطالعه حاضر این شیوه به کار بسته شد تا اطلاعات بیشتری در مورد پاسخ های دانش آموزان پایه چهارمِ شرکت کننده در آزمون علوم مطالعه تیمز 2015 استخراج شود.روش پژوهش: 11 خصیصه مهم در آموزش علوم شناسایی و با بررسی سؤالات ماتریس Q تشکیل شد. سپس، پاسخ 3823 دانش آموزی که 206 سؤال آزمون علوم را داده بودند، با استفاده از مدل تشخیصی جی دینا تحلیل شد.یافته ها: نتایج نشان داد که این مدل قدرت تولید اطلاعات تشخیصی را دارد. در مقایسه احتمال پاسخ خصیصه ها مشخص شد که سه خصیصه بازشناسی، ارائه مثال، و توصیف احتمال بالاتری نسبت به سایر خصیصه ها نشان دادند و احتمال تسلط بر آن ها از 50/0 بیشتر بود. با این حال، تنها خصیصه بازشناسی از ملاک مقبولِ 65/0 بیشتر بود. از طرف دیگر، دو خصیصه پیش بینی و کاوشگری علمی کم ترین احتمال پاسخ را داشتند.نتیجه گیری: نتایج نشان داد که به طور کلی تفاوت زیادی بین احتمال پاسخِ خصیصه های دانشی و خصیصه های دربرگیرنده تفکر سطح بالا در بین دانش آموزان ایران وجود دارد که می تواند به فاصله گرفتن برنامه اجرا شده علوم از برنامه مصوب آن مربوط باشد.
الگوی چندسطحی واکاوی نمرات آزمون سراسری ورود به دانشگاه ها و موسسات آموزش عالی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف: هدف اصلی مقاله حاضر ارائه الگوی چندسطحی واکاوی نمرات آزمون سراسری ورود به دانشگاه ها و موسسات آموزش عالی می باشد.روش پژوهش: پژوهش حاضر به لحاظ هدف از نوع تحقیقات کاربردی و توصیفی است که به دنبال تحلیل و تبیین عوامل موثر بر نمره کل داوطلبان در آزمون ورود به دانشگاه ها است. در این خصوص اطلاعات آزمون سراسری سال 1398 شامل داده های مربوط به موقعیت اجتماعی اقتصادی خانواده داوطلبان و متغیرهای آموزشی، بهداشتی، فرهنگی و اقتصادی مربوط به شهرستان ها و استان های کشور را بکار گرفتیم و برای برآورد مدل های چندسطحی از نرم افزار HLM استفاده شد.یافته ها: مقادیر همبستگی درون گروهی و پایایی الگوی مولفه واریانس ساختار سلسله مراتبی داده ها را به صورت تجربی تایید کرد. تخمین الگوی سه سطحی نشان داد که 6/94 درصد از تغییرات نمره کل آزمون به تفاوت در ویژگی های فردی و خانوادگی داوطلبان مربوط می شود. 6/3 درصد از تغییرات نمره کل به عامل های آموزشی، بهداشتی و فرهنگی شهرستان و 8/1 درصد به نرخ مشارکت اقتصادی استان مربوط می شود. اثر کاهشی متغیر جنسیت برای جنس مرد و اثر افزایشی متغیر مجموع سال های تحصیل والدین در الگو قابل پذیرش شد.نتیجه گیری: با استفاده از تخمین الگوی چندسطحی به صورت تجربی نشان داده شد که واریانس سطح اول که شامل متغیرهای موقعیت اجتماعی اقتصادی داوطلبان است بیشترین سهم را در واریانس نمره کل دارد و با توجه به اینکه 4/5 درصد از تغییرات نمره کل مربوط به موقعیت جغرافیایی است، می توان اذعان داشت تفاوت در نمره کل داوطلبان، نه تنها ریشه در موقعیت اجتماعی اقتصادی آنها دارد، بلکه تاثیر همزمان این موقعیت با سطح برخورداری استان ها و شهرستان های کشور در تشدید تفاوت در نمره کل ها سهیم است.
مطالعه تطبیقی نظریه های تصمیم گیری و انتخاب تحصیلی شغلی: راهبردی برای ارزیابی و بهبود برنامه هدایت تحصیلی شغلی نظام آموزش و پرورش ایران(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف: پژوهش حاضر با هدف مطالعه تطبیقی نظریه های تصمیم گیری و انتخاب تحصیلی شغلی و به منظور ارائه راهبردی برای ارزیابی و بهبود برنامه هدایت تحصیلی شغلی نظام آموزش وپرورش ایران انجام شده است.روش پژوهش: این پژوهش با رویکرد تطبیقی و با روش تحلیلی اسنادی صورت پذیرفته است. بنابراین، اسناد نظری با بهره گیری از کلیدواژه های مرتبط و کتابخانه های دیجیتال و پایگاه های داده آنلاین گردآوری و از طریق فیش برداری محقق ساخته و تکنیک های تلخیص و طبقه بندی داده ها تحلیل گردیدند. جهت بررسی اعتبار یافته ها از معیارهای خود بازبینی محقق در طی فرایند جمع آوری و تحلیل داده ها و همچنین از توسعه و توصیف غنی داده ها جهت اطمینان از قابلیت انتقال پذیری استفاده شد.یافته ها: عوامل اثرگذار در هدایت تحصیلی شغلی مبتنی بر نظریه های ارائه شده را می توان در سه بخش، شامل عوامل فردی، عوامل اجتماعی و عوامل محیطی اجتماعی دسته بندی نمود. نتایج ارزیابی برنامه هدایت تحصیلی شغلی نظام آموزش و پرورش ایران با طبقه بندی احصاء شده نیز نشان داد، علیرغم توجه به برخی از این عوامل، اما برنامه هدایت تحصیلی شغلی در اجرا چندان موفق نبوده است.نتیجه گیری: اثربخشی برنامه های هدایت تحصیلی شغلی مستلزم شناسایی و درنظر گرفتن همه عوامل اثرگذار در این حوزه است. در این زمینه با طراحی و اجرا برنامه درسی هدایت تحصیلی شغلی می توان تمام عوامل و ملاک هایی که در پایگاه نظری به عنوان عوامل مهم در انتخاب تحصیلی شغلی مطرح شده اند را طی فرایند و گام های سیستماتیک در کل مقاطع تحصیلی دانش آموزان در نظر گرفت.
کاربرد مدل های چند ارزشیIRT در نمره گذاری آزمون های سرنوشت ساز (مورد مطالعه: آزمون پروانه وکالت)(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف: هدف مطالعه حاضر، مقایسه میزان دقت و خطای اندازه گیری مدل های دوارزشی و چند ارزشیIRT در نمره گذاری آزمون های توانایی سرنوشت ساز بود.روش پژوهش: جامعه پژوهش شامل تمامی شرکت کنندگان آزمون سراسری پروانه وکالت سال های 1396 و 1398 بوده که از میان آن ها تعداد 5000 نفر از سال 1396 و تعداد 5000 نفر از سال 1398 با روش نمونه گیری تصادفی ساده انتخاب شدند. همچنین، گردآوری داده ها با استفاده از پاسخ های شرکت کنندگان آزمون انجام یافت. متغیر مستقل این پژوهش، شیوه و مدل نمره گذاری و متغیر وابسته، میزان برازش و آگاهی (دقت) مدل محسوب می شود. بر این اساس، روش پژوهش آزمایشی است.یافته ها: تجزیه و تحلیل یافته ها نشان داد که از میان مدل های لجستیک دوارزشی IRT، مدل 3 پارامتری، و از میان مدل های چندارزشی اسمی مورد مطالعه نیز، مدل 3 پارامتری در مقایسه با سایر مدل ها، برازش و نیز آگاهی دهندگی بیشتر و مطلوب تری بر روی داده های مورد مطالعه داشتند.نتیجه گیری: با توجه به برازش و میزان آگاهی مطلوب تر مدل 3 پارامتری دو ارزشی و مدل 3 پارامتری چندارزشی در مقایسه با سایر مدل ها، استفاده از این مدل ها در نمره گذاری می تواند به افزایش دقت اندازه گیری و کاهش خطا، و نیز به منصفانه بودن فرآیند گزینش متقاضیان آزمون پروانه وکالت کمک نماید.
بررسی رتبه دهی ارزیابان آزمون های عملکردی سراسری (طراحی صنعتی، شناخت موسیقی، نمایش عروسکی، طراحی معماری و اسکیس معماری) بر اساس روش های کلاسیک و مدل های چندوجهی راش(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف: پژوهش حاضر به منظور بررسی میزان جدیت/تساهل و گرایش به مرکز ارزیابان در نمره گذاری آزمون های عملکردی سراسری سازمان سنجش انجام شد.روش پژوهش: برای این منظور از داده های ثانویه آزمون های طراحی معماری سال های 1396 (5437 نفر)، اسکیس معماری 1397 (7459 نفر)، طراحی صنعتی سراسری سال 1396 (1365نفر)، موسیقی سال 1397 (569 نفر) و نمایش عروسکی سال 1397 (97 نفر) استفاده شد. داده ها با استفاده از روش های کلاسیک و مدل های چند وجهی راش تحلیل و نتایج استخراج شد.یافته ها: در هر دو آزمون طراحی معماری، در کل میزان همسانی (مطابقت نسبی بین درجه بندی ارزیابان) قابل قبول، ولی در آزمون های طراحی صنعتی، شناخت موسیقی و نمایشنامه نویسی میزان همسانی پایین است. میزان اجماع (توافق) در هر پنج آزمون مورد بررسی نیز پایین است.نتیجه گیری: نتایج حاصل از مدل های چندوجهی نشان داد اثر سخت گیری ارزیاب و استفاده از نمره های کرانه ای پایین در نمره گذاری، در هر دو آزمون طراحی معماری وجود داشت، ولی مطابق انتظار اثر گرایش به مرکز وجود نداشت. به دلیل استفاده از طرح های جمع آوری داده های نامناسب (مثلا در همه پاسخ ها یا تکالیف یک آزمون، هر داور فقط 2 مورد مجزا از هم را ارزیابی می کند و هیچ همپوشی بین موارد ارزیابی شده توسط ارزیابان وجود ندارد تا با هم به صورت درست مقایسه شوند یا این که در یک آزمون هر تکلیف یا سوال توسط داوران متفاوت ارزیابی می شود) در آزمون های طراحی صنعتی، شناخت موسیقی و نمایشنامه نویسی امکان تحلیل با مدل های چندوجهی وجود نداشت. با توجه به یافته ها توصیه می شود به هنگام ارزیابی آزمون های عملکردی سراسری، اولا از طرح مناسب برای ارزیابی استفاده شود و دوما با آموزش ارزیابان در زمینه نمره گذاری آزمون های عملکردی از تاثیر عواملی مثل جدیت یا تساهل و کاهش توافق جلوگیری به عمل آید.
تحلیل محتوای انواع مقالات مرتبط با الگوهای ارزشیابی برنامه درسی بر اساس تاکید بر عناصر برنامه درسی و معیارهای اثربخشی درونی و بیرونی(مقاله علمی وزارت علوم)
حوزه های تخصصی:
هدف: هدف کلی از انجام این پژوهش، تحلیل محتوای انواع مقالات مرتبط با الگوهای ارزشیابی برنامه درسی بر اساس تاکید بر عناصر برنامه درسی و معیارهای اثربخشی درونی و بیرونی بوده است.روش پژوهش: کمی، از نوع توصیفی و بر اساس تحلیل محتوای کمّی می باشد. جامعه آماری تمامی منابع پژوهشی چاپ شده در حوزه ارزشیابی برنامه درسی است و تمامی آن ها بروز، در بازه زمانی پنج ساله 2017 تا 2022 و 1396 تا 1401 به عنوان نمونه انتخاب گردیدند. ابزار اندازه گیری اسنادی و روش گردآوری داده ها بر مبنای الگوهای ارزشیابی برنامه درسی و تجزیه و تحلیل داده ها با استفاده از تکنیک آنتروپی شانون انجام شد.یافته ها: از میان ده عنصر، محتوا بالاترین و کارسازترین ضریب اهمیت و زمان یادگیری دارای کمترین ضریب اهمیت بود. در معیارهای ارزشیابی درونی و بیرونی، منطق دارای بالاترین ضریب اهمیت و انسجام دارای کمترین ضریب اهمیت بود. همچنین، از بین انواع الگوهای ارزشیابی برنامه درسی که برای تحلیل محتوای مقالات منتخب استفاده شد، الگوی کرک پاتریک موثرترین و بالاترین ضریب اهمیت و الگوی تین دارای کمترین ضریب اهمیت بود.نتیجه گیری: جهت حصول اطمینان در مورد چگونگی اجرای صحیح یک برنامه درسی و بهبود و ارتقاء برنامه های درسی در حوزه آموزش و پرورش ضروری ست که اثربخشی همه عناصر برنامه درسی و معیارهای درونی و بیرونی برنامه درسی، در تحلیل ارزشیابی مقالات مورد توجه قرار گیرند.