ارائۀ یک چارچوب مفهومی برای پیش پردازش و بهبود کیفیت نگاره های رویداد در فرایندکاوی(مقاله علمی وزارت علوم)
در دنیای پیچیده امروز حیات سازمان ها و کسب وکارها بدون شناخت و استفاده کارآمد از داده ها امکان پذیر نخواهد بود. فرایندکاوی با ترکیب روش های یادگیری ماشین و مفاهیم مدیریت فرایندهای کسب وکار، تلاش دارد تا دانش نهان مربوط به چگونگی اجرای فرایندها را از داده های ذخیره شده در سامانه های اطلاعاتی استخراج نماید. اولین گام در فرایندکاوی، فعالیت کشف فرایند است که امکان مدل سازی فرایندها بر مبنای داده های رویداد ورودی را فراهم می سازد. اما استفاده از این مزیت بدون وجود داده های مناسب و با کیفیت فراهم نخواهد شد، زیرا هرگونه تحلیل بر پایه داده های با کیفیت پایین منجر به ایجاد بینش و تصمیمات نامناسبی می شود که بر عملکرد سازمان یا کسب وکار تاثیر منفی خواهند گذاشت. هدف این پژوهش ارائه یک چارچوب مفهومی جدید برای پیش پردازش داده های ورودی به روش های کشف فرایند است تا کیفیت مدل فرایند نهایی بهبود یابد. چارچوب مفهومی پیشنهادی با استفاده از یک روش پژوهش کیفی بر اساس نظریه داده بنیاد پدید آمده است. بدین منظور 102 پژوهش مرتبط با حوزه کیفیت داده در فرایندکاوی مورد بررسی قرار گرفته و مهمترین چالش های کیفیت داده در این زمینه پس از پالایش و یکپارچه سازی آن ها از ادبیات شناسایی شده اند که شامل: «رویدادهای آشفته/کم تکرار»، «رویدادهای پرت»، «رویدادهای ناهنجار»، «مقادیر گمشده»، «قالب زمانی نادرست»، «برچسب های زمانی مبهم»، «فعالیت های مترادف» و «اندازه و پیچیدگی» می باشند. در ادامه گام های اساسی برای پیش پردازش و پاک سازی مناسب داده ها تعیین شده اند که در برگیرنده فعالیت های «ترمیم»، «کشف ناهنجاری»، «پالایش» و «کاهش ابعاد» می شوند. سپس چارچوب مفهومی نهایی بر پایه مشکلات کیفیت داده و فعالیت های پاک سازی شناسایی شده، ایجاد شده است. برای بررسی عملکرد چارچوب پیشنهادی از چهار مجموعه داده استاندارد برگرفته از فرایندهای واقعی استفاده شده است، که این داده ها در مرحله اول به صورت خام و در مرحله دوم پس از انجام پیش پردازش توسط چارچوب معرفی شده به چهار الگوریتم متداول کشف فرایند اعمال شده اند. نتایج نشان داد که پیش پردازش داده های ورودی منجر به بهبود معیارهای کیفیت مدل استخراج شده از الگوریتم های کشف فرایند می شود. همچنین برای سنجش اعتبار چارچوب پیشنهادی، عملکرد آن با سه روش پیش پردازش «نمونه برداری»، «پیش پردازش آماری» و «انتخاب نمونه اولیه» مقایسه شده، که برآیندها بیانگر کارایی بهتر رویکرد پیشنهادی بوده است. نتایج پژوهش حاضر می تواند به عنوان یک رهیافت کاربردی توسط متخصصان و تحلیلگران داده و کسب و کار در پروژه های فرایندکاوی مورد استفاده قرار گیرد.