مطالب مرتبط با کلیدواژه

شاخص Dunn


۱.

استفاده از الگوریتم های دسته بندی و خوشه بندی برای پیش بینی تعداد قرص مصرفی: مورد کاوی بیماری دیابت(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: دیابت خوشه بندی دسته بندی درخت تصمیم شاخص Dunn

حوزه های تخصصی:
تعداد بازدید : ۴۴۳۷ تعداد دانلود : ۲۰۸۴
مقدمه: امروزه با شیوع بیماری دیابت پیش بینی تعداد قرص مصرفی Glibenclamid و Metformin روزانه برای بیماران به پزشکان در جهت تشخیص تعداد قرص مصرفی بیمار و همچنین مهار عوارض شدید و خطرناک مصرف بیش از حد دارو کمک می نماید، زیرا میزان نیاز بیماران دیابتی به دارو دارای اهمیت بسیار می باشد. از این رو در پژوهش حاضر به منظور پیش بینی تعداد قرص مصرفی روزانه ی بیماران دیابتی، از تکنیک های داده کاوی استفاده شد. در پایان الگوریتمی که نتیجه ی بهتری در فرآیند ارزیابی بدست می دهد، با توجه به مجموعه داده های تحت بررسی، انتخاب می شود. روش بررسی: مطالعه ی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونه گیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصله ی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعه ی پژوهش متشکل از داده های مرکز تحقیقات دیابت یزد وابسته به دانشگاه علوم پزشکی شهید صدوقی یزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحله ی پیش پردازش داده ها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهایی که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافته ها با مراجعه ی مستقیم پژوهشگر به مرکز تحقیقات دیابت یزد حاصل شده و روایی روش جمع آوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه داده های آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل داده ها و اجرای الگوریتم های داده کاوی از نرم افزار Clementine 12.0 استفاده شد. دو الگوریتم متفاوت از الگوریتم های استنتاج قانون به نام های C5.0 و CHAID روی داده ها اعمال گردید و سپس صحت مدل های تولید شده بدست آمد. در نهایت برای تایید صحت مدل های تولید شده از خوشه بندی استفاده گردید. یافته ها: مقادیر به دست آمده برای صحت مدل های ایجاد شده از اجرای الگوریتم های C5.0 و CHAID روی مجموعه داده های تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل C5.0 عملکرد بهتر این الگوریتم برای پیش بینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشان دهنده ی این بود که برخی مقادیر به طور صحیح در جای خود دسته بندی نشده اند. بنابراین مقایسه ی مقادیر واقعی و مقادیر پیش بینی شده برای تعداد قرص مصرفی در تولید مدل می تواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادیر پیش بینی شده ای وابسته بود که در مقایسه با مقادیر واقعی صحت و ضریب اطمینان پایینی دارند. خوشه بندی نتایج بدست آمده از اجرای الگوریتم C5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیش بینی شده ی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه داده هایی که دارای صحت پایینی در پیش بینی تعداد قرص مصرفی بود و یا تعداد نمونه داده ی کمی داشت، در یک خوشه قرار گرفتند. همچنین خوشه بندی نتایج اجرای الگوریتم CHAID نیز تعداد قرص مصرفی 5 با صحت مقدار پیش بینی شده ی 93/20 را در یک خوشه قرار داد. نتیجه گیری: این مقاله حاصل پروژه ی تحقیقاتی گروه داده کاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و به صورت پژوهش حاضر درآمد. در مراکز تحقیقات دیابت وجود رویکرد سازمان دهی شده جهت پیش بینی تعداد قرص مصرفی بیمار به منظور کمک به پزشک برای افزایش صحت تشخیص و جلوگیری ازعوارض جانبی ناشی از تشخیص نادرست در تعداد قرص خوراکی ضروری است. با توجه به لزوم استفاده از فن آوری های رایانه ای، اینترنت و نرم افزارهای تحلیلی و به منظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رویکردهای پیشنهادی با مشاوره ی متخصصان مربوط انجام شود.