يهدف البحث من خلال اعتماده النهج التنبؤي للتنبؤ بالحملات التسويقية المباشرة (الهاتفية) لتوقع إيداعات العملاء في بنك (Banco Português de Investimento) البرتغالي/ بورتو، وكانت فترة جمع البيانات ممتدة من (2008) إلى (2013) وتحديدا من الشهر (4) إلى الشهر (12) في كل سنة، وقمنا بتحليل مجموعة من البيانات تتكون من (23) سمة يتعلق أغلبها بعميل البنك وبعض منها يخص جهة اتصال والحملة التسويقية، وتمت إضافة سمات اجتماعية واقتصادية جديدة.
تم شرح محتوى البيانات وتحليلها من خلال تصوير البيانات (DV) لفهم المعلومات التي تحملها سمات هذه البيانات من أجل البحث في تقنيات التنقيب عن البيانات لاختيار تقنية ملائمة لطبيعة البيانات والمشكلة المدروسة، وقد تم اختيار تقنية التصنيف ردا لطبيعة البيانات التي تحمل سمة (attributes) إخراج مكونة من خيار ثنائي (Yes/No)، وتم اختيار (5) خوارزميات للتصنيف سيتم بناء المصنفات من خلالاهم وهم " الغابات العشوائية (Random Forest)، شجرة القرار (Decision Tree J48)، الانحدار اللوجيستي (logistic regression)، الجار الأقرب (KNN)، وبايز الساذج (naive bayes) "، ثم تم تحضير البيانات المدروسة لإدخالها على خوارزميات التصنيف وقد تم بمرحلة تحضير البيانات المتألفة من عدة مراحل بالاستغناء عن عدة سمات (attributes) من خلال تحليل الارتباط الذي يبحث عن الارتباطات المخفية بين هذه السمات، وقد تم حل مشكلة عدم توازن البيانات باستخدام مبدئ (Random Oversampling)، وبعد عملية التحضير سيتم تطبيق الخوارزميات السابقة عليها لبناء المصنفات واختيار المصنف الأمثل من خلال المقارنة في ما بينهم بعدة معاير وهم (الدقة (accuracy) والإحكام (precision) والحساسية (recall)، وبعدما تمت المقارنة المقارنة بين نتائج المصنفات ال خمس المستخدمة أتضح أن مصنف الغابات العشوائية (Random Forrest) قد حصل تميز بجميع نتائج معايره على المعاير الأخرى من حيث الدقة بمعدل (%95.3)، وإضافة نتائج خاصة بسمات معينة للحصول على نتائج عالية للحملات التسويقية جنبا بجنب مع مصنف الغابات العشوائية (Random Forest).