امروزه سرمایه گذاران با توجه به فضای رقابتی حاکم باید محتاط تر از قبل تصمیم بگیرند. به این منظور آنها می توانند از بانک های اطلاعاتی بورس اوراق بهادار استفاده کنند. اما این اطلاعات به تنهایی مثمر ثمر نیست، بنابراین لازم است با استفاده از فنون داده کاوی تجزیه، تحلیل و تفسیرداده ها انجام شود تا اطلاعات قابل اتکاتری در اختیار استفاده کنندگان قرار گیرد. هدف این پژوهش خوشه بندی و پیش بینی سودآوری شرکت ها و تعیین عوامل موثر بر سودآوری شرکت های عضو بورس اوراق بهادار تهران است. جهت این کار، 888 شرکت-سال در محدوده زمانی 1395-1387 انتخاب شدند. پس از پیش پردازش اولیه داده ها، با نرم افزارهای متلب و Clementine و با استفاده از معیار SSE و روش K-Means شرکت ها به 3 خوشه تبدیل شدند و نتایج این خوشه بندی ها بوسیله معیار سنجش کیفیت، مورد سنجش قرار گرفت. در ادامه با استفاده از درخت تصمیم C5 خوشه ها تحلیل و متغیرهای تاثیرگذار بر سودآوری، شناسایی شد. از32 متغیر تحلیل شده تنها 8 متغیر شامل: سودخالص به کل دارایی ، فروش به کل دارایی، سودخالص به حقوق صاحبان سهام، سود عملیاتی به فروش خالص، سود و زیان انباشته به حقوق صاحبان سهام، سودخالص به فروش خالص، کل بدهی ها به کل دارایی ها و دارایی های جاری به کل دارایی ها بر سودآوری شرکت ها تاثیر می گذارند. در نهایت با درنظرگرفتن این متغیرها، پیش بینی سودآوری شرکت ها طبق هرخوشه انجام شد که دقت پیش بینی خوشه ها به ترتیب 34/86 درصد، 15/88 درصد و 68/81 درصد است.