شناسایی ویژگی های داده درخور جهت کشف دانش از سیستم های کلان داده سلامت (مقاله پژوهشی دانشگاه آزاد)
درجه علمی: علمی-پژوهشی (دانشگاه آزاد)
آرشیو
چکیده
هدف: هدف مطالعه حاضر ارائه و معرفی عوامل تأیید کننده مطلوبیت ویژگی های داده های مورد استفاده جهت کشف دانش از سیستم های کلان داده سلامت بوده است. روش پژوهش: پژوهش پیش رو مطالعه توصیفی-تحلیلی است. جامعه آماری متخصصان حوزه علوم داده، بیوانفورماتیک و تحلیل اطلاعات سلامت داخل و خارج از کشور بودند که با استفاده از روش گلوله برفی 655 نفر از آنها شناسایی شده، و برای آنها ابزار پژوهش پرسشنامه محقق ساخته ارسال شد که 247 پرسشنامه را تکمیل و برگرداندند. روش استفاده شده تحلیل داده ها، تحلیل عاملی اکتشافی و تأییدی با استفاده از نرم افزارهای0/26 SPSS و 8/8 Lisrel بوده است. یافته ها: نتایج تحلیل عاملی اکتشافی، شش عامل برای شناسایی ویژگی های داده درخور تبیین نمود که عبارتند از کیفیت داده، پایداری داده، سازگاری داده، ارزشمندی و دسترسی پذیری داده، کارایی داده و صحت و کامل بودن و روی هم رفته 68 درصد از واریانس کل داده ها را دربرداشته است. شاخص های برازش تحلیل تأییدی نشان داد که الگوی شش عاملی برازش قابل قبولی با داده ها دارد. نتیجه گیری: یافته های پژوهش حاکی از آن است که بر اساس مدل ارائه شده ویژگی های داده بر فرایند کشف دانش از سیستم های کلان داده سلامت تاثیر دارد و شش عامل شناسایی شده و 20 گویه سازنده این عوامل، می تواند ابزار مناسبی جهت شناسایی ویژگی های داده های مناسب برای کشف دانش از سیستم های کلان داده سلامت جهت به کارگیری موثر این سیستم ها باشد که با تاکید بر عدم وابستگی به فرمت داده، خصایص فراگیر داده های حوزه سلامت را دربرگرفته و توجه به آن می تواند به تشخیص و درمان زودهنگام بیماری ها کمک شایانی کند.Identify Appropriate Data Attributes in order to Knowledge Discovery from Health Big Data Systems
Objective: This study aimed to introduce the factors confirming the desirability of the data attributes in order to knowledge discovery from health big data systems by using factor analysis. Methodology: This research was a Survey-Analytical study. The statistical population consisted of 655 specialists in the fields of data science, bioinformatics, and health information analysis inside and outside Iran, who were identified by snow flack method, and the research tool, researcher-made questionnaire was sent for them, and 247 questionnaires were completed and turned back. Data analysis methods were exploratory and confirmatory factor analysis using SPSS 22.0 and Lisrel 8.8 software. Results: The results of Exploratory Factor Analysis explained six factors for identifying data characteristics that are: data quality, data stability, data compatibility, data value and accessibility, data efficiency and accuracy and completeness, which altogether had 68% of the total variance of the data. Confirmation analysis fit indices showed that the six-factor model has an acceptable fit with the data. Conclusion: Findings indicate that based on the proposed model, data properties affect the process of knowledge discovery of health big data systems and six identified factors and 20 items of these factors, can be a good tool to identify the characteristics of data suitable for knowledge discovery of health big data systems for the effective use of these systems, emphasizing the independence of data format, and can help in the early diagnosis and treatment of diseases.