Search In this Thesis
   Search In this Thesis  
العنوان
Developing an Intelligent System Based on Knowledge Engineering Paradigms for Bankruptcy Prediction \
المؤلف
Khalifa, Samar Aly Mohamed Taha.
هيئة الاعداد
مشرف / سمر علي محمد طه خليفه
مشرف / عبد البديع محمد سالم
مشرف / ماركو الفونس توفيق
مناقش / عبد البديع محمد سالم
تاريخ النشر
2022.
عدد الصفحات
108 p. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
Computer Science Applications
تاريخ الإجازة
1/1/2022
مكان الإجازة
جامعة عين شمس - كلية الحاسبات والمعلومات - علوم الحاسب
الفهرس
Only 14 pages are availabe for public view

from 108

from 108

Abstract

يعد التنبؤ المبكر بأحداث الإفلاس أحد أهم الموضوعات في مجال التمويل واتخاذ قرارات الاستثمار. يمكن أن يؤدي الإفلاس إلى عواقب وخيمة على كل من الاقتصاد الجزئي والكلي. يتطلب منع المؤسسات المالية من الإفلاس نماذج فعالة للتنبؤ بالإفلاس. للتنبؤ بالإفلاس، طبقت بعض الدراسات تقنيات إحصائية تقليدية، بينما طبقت دراسات أخرى تقنيات الذكاء الاصطناعي (AI). أجرى هذا البحث دراسة مقارنة بين دراسات متنوعة بمجموعات بيانات مختلفة في التنبؤ بالإفلاس بتقنيات مختلفة.
الهدف الرئيسي من هذه الدراسة هو تحديد قوة وضعف النماذج المطبقة للتنبؤ بالإفلاس وتأثيرها. أثبتت هذه الدراسة أن تقنيات الذكاء الاصطناعي وخاصة التعلم الآلي أكثر كفاءة من التقنيات الإحصائية في التنبؤ بالإفلاس. تم استخدام المصنفات القائمة على التعلم الآلي بشكل كبير في التنبؤ بالإفلاس. على الرغم من تنوع النماذج الحالية للتنبؤ بالإفلاس، فإن العثور على نموذج يحقق قياسًا عالي الأداء مع العمل على مجموعات البيانات غير المتوازنة يعد موضوعًا مثيرًا للاهتمام للبحث. وذلك لأن مجموعة البيانات غير المتوازنة تضلل نتائج التصنيف.
لذلك، حاول هذا البحث تصميم نموذجين فعالين للتعلم الآلي للتنبؤ بالإفلاس أثناء حل مشكلة مجموعة البيانات غير المتوازنة. البيانات المستخدمة مع النموذج الأول عبارة عن مجموعة مختارة من ثلاث مجموعات بيانات مختلفة غير متوازنة، وهي مجموعات البيانات البولندية والأسترالية والألمانية. يتكون النموذج الأول من ثلاث مراحل رئيسية: المعالجة المسبقة لمجموعة البيانات، وإعادة أخذ عينات مجموعة البيانات، وتطبيق مصنفات متنوعة للتعلم الآلي للتنبؤ بالإفلاس.
طبق النموذج الأول أربع استراتيجيات متنوعة لإعادة أخذ العينات لتحقيق التوازن بين مجموعة بيانات تدريب الإدخال للحصول على أداء أكثر موثوقية. طبق النموذج الأول أيضًا ست مصنفات للتعلم الآلي للتنبؤ بالإفلاس. أظهرت أفضل النتائج التجريبية للنموذج الأول أن مقاييس أداء الدقة والمساحة تحت المنحنى (AUC) هي 97٪ و95.4٪ على التوالي مع مجموعة البيانات البولندية. علاوة على ذلك، أظهرت أفضل النتائج التجريبية للنموذج الأول أن مقاييس أداء الدقة والمساحة تحت المنحنى (AUC) هي 88.4٪ و92٪ على التوالي مع مجموعة البيانات الأسترالية. وأظهرت أفضل النتائج التجريبية للنموذج الأول أن مقاييس أداء الدقة و (AUC) بلغت 81.5٪ و83.4٪ على التوالي مع مجموعة البيانات الألمانية.
يتكون النموذج الثاني من أربع خطوات رئيسية: المعالجة المسبقة لمجموعة البيانات، وإعادة أخذ عينات من مجموعة بيانات التدريب، وتحديد الميزة الأكثر صلة من مجموعة البيانات، ثم تطبيق مصنف CatBoost للتنبؤ بالإفلاس. استخدم النموذج الثاني الإفراط في أخذ العينات كأسلوب جيد لإعادة أخذ العينات. استخدم النموذج الثاني مصنف التعزيز الفئوي (CatBoost) للتصنيف بين الفئات المفلسة وغير المفلسة. علاوة على ذلك، فإن الهدف الرئيسي للنموذج الثاني هو تقليل أبعاد مجموعة البيانات المستخدمة لزيادة أداء التصنيف. طبق النموذج الثاني ثلاث طرق متنوعة لاختيار الميزات. تم تقييمه على مجموعة البيانات البولندية غير المتوازنة. أظهرت النتائج التجريبية للنموذج الثاني فاعلية النموذج المقترح وفق مقياس الدقة.
للتنبؤ بإفلاس مجموعات البيانات البولندية لخمس سنوات، كانت مقاييس الأداء للنموذج الثاني من حيث الدقة هي 98٪ و98٪ و97٪ و97٪ و95٪ على التوالي.
تتكون الرسالة من ستة فصول وهما كالتالي:
يتضمن الفصل الأول مقدمه لموضوع البحث وتمهيد لمشكله الإفلاس سواء على الاقتصاد المحلي او العالمي واهميه التنبؤ بالإفلاس للحد من عواقب الإفلاس، اهداف الرسالة الرئيسية، المساهمات المقدمة
من هذه الرسالة وتنظيم فصول الرسالة.
يتضمن الفصل الثاني عرض توضيحي لمفهوم الإفلاس والأنظمة الذكية ومتطلباتها ومن ضمنهم الذكاء الاصطناعي والتعلم الآلي. كما انه يعرض أيضا التقنيات الإحصائية التقليدية وتقنيات الذكاء الاصطناعي المساهمين في التنبؤ بمشكله الإفلاس بالتفصيل وأكثر وضوحا ومن ضمنهم بعض التقنيات التي استخدمت للتجارب البحثية لهذه الرسالة.
يتضمن الفصل الثالث عرض كثير من التطبيقات المختلفة للتنبؤ بمشكله الإفلاس وعرض اهميه الذكاء الاصطناعي والتعلم الآلي وتطبيقاتها في التنبؤ بالإفلاس، ثم سرد المساهمات والتطبيقات السابقة وقدرتها على التنبؤ بالإفلاس والمقارنة بينها، كما انه يعرض أيضا جميع البيانات الأكثر استخداما لتقييم التقنيات المقدمة.
يتضمن الفصل الرابع عرض النموذج الأول المقدم في هذه الرسالة الذي يسعي لسرعه التنبؤ بمشكله الإفلاس باستخدام أساليب مختلفة من مجموعات التعلم الآلي، ثم عرض النتائج العلمية من البحث المقدم ومقارناتها مع أساليب وأبحاث أخري وايضا يحتوي على مناقشة لهذه النتائج. كما ان تم تطبيق أربع تقنيات مختلفة من خلال النموذج الأول علي مجموعه البيانات المستخدمة غير المتوازنة لإعادة تشكيلها لجعلها مناسبه ل تقنيات التعلم الآلي وللحصول على نتائج أكثر كفاءه. استطاع هكذا الفصل تحديد النموذج الأكثر كفاءه من كلا من البيانات المستخدمة، ويتكون كل نموذج من معالجه البيانات المستخدمة عن طريق ملء البيانات الفارغة واعاده تشكيل البيانات غير المتوازنة، ثم تطبيق أحد تقنيات التعلم الآلي، ثم اختبار النموذج عن طريق اختبار مجموعه من البيانات.
يتضمن الفصل الخامس عرض النموذج الثاني المقدم في هذه الرسالة باستخدام CatBoost كنموذج من مجموعات التعلم الآلي، وتطبيق تقنيات لتقليل ابعاد البيانات واختيار الخصائص الأكثر كفاءه، كما انه يستخدم تطبيق SMOTE لإعادة تشكيل مجموعه البيانات المستخدمة لتكون أكثر اتزانا. ثم عرض النتائج العلمية من البحث المقدم ومقارناتها مع أساليب وأبحاث أخري وايضا يحتوي على مناقشة لهذه النتائج.
يتضمن الفصل السادس ملخص قصير لما تم تقديمه في هذه الرسالة، ثم عرض جميع الاستنتاجات من الابحاث المقدمة مع الاقتراحات المستقبلية التي يمكن تطبيقها.