يعد تحليل وتوقع سلوك الزبون فيما إذا كان سيتسرب إلى المنافسين أم لا أحد أهم العمليات لمؤسسات الأعمال والشركات في مختلف المجالات، وخصيصاً شركات الاتصالات، نظراً لكون الزبون أهم الموارد بالنسبة لها، وكونه ذو أثر كبير على ربح هذه الشركات، ولهذا اتجهت الشركات لاستباق خطوات عن المنافسين وحل بعض من مشاكلها، والتي أهمها التنبؤ بتسرب الزبائن، ومعرفة الأسباب وراء التسرب وما أكثر العوامل المؤثرة في زيادته، واتخاذ الخطوات الاستباقية اللازمة للحد من هذه المشكلة.
يهدف ويسعى هذا البحث لبناء نموذج تصنيفي قادر على التنبؤ بتسرب الزبائن من شركة اتصالات، أولاً باتباع طرق عديدة لتحضير البيانات واختيار المتغيرات، ومن ثم الاستفادة من هذه البيانات في بناء المصنف باستخدام تقنيات التنقيب في المعطيات.
جرى هذا النظام على قاعدة بيانات زبائن تابعين لشركة اتصالات X ، وبعد تطبيق 5 خوارزميات (Logistic regression , SVM , KNN , J48, Random Forest )، و المقارنة بينهما حسب المعايير Accuracy)، Recall، Kappa statistic، Precision)، تم اختيار مصنف الغابة العشوائية Random) Forest (الذي أعطى أعلى دقة، حيث وصلت نسبة الدقة إلى 85%.
ومن خلال تحليل البيانات والنتائج والمعلومات المستخرجة، والتي طبقت عبر تصوير البيانات تمكن الباحث من معرفة بعض العوامل المؤثرة والأسباب وراء تسرب الزبائن من شركة اتصالات.