Search In this Thesis
   Search In this Thesis  
العنوان
اكتشاف وقياس أثر القيم الشاذة علي تقدير نماذج بيانات البانل مع التطبيق /
المؤلف
عبد التميمي، حازم غازي.
هيئة الاعداد
باحث / حازم غازي عبد التميمي
مشرف / صلاح مهدى محمد
مشرف / محمد زايد الدسوقي
مشرف / محمد إبراهيم حليل
الموضوع
الإحصاء الرياضي.
تاريخ النشر
2020.
عدد الصفحات
133 ص. ؛
اللغة
العربية
الدرجة
ماجستير
التخصص
الإحصاء والاحتمالات
تاريخ الإجازة
1/1/2020
مكان الإجازة
جامعة بنها - كلية التجارة - الاحصاء
الفهرس
يوجد فقط 14 صفحة متاحة للعرض العام

from 148

from 148

المستخلص

تناولت الدراسة تأثير القيم الشاذة على تقدير نماذج بيانات البانل، وهدفت إلى عدة أهداف أهمها: اكتشاف القيم الشاذة باستعمال الطرق المعلمية واللامعلمية حيث تم الكشف عن القيم الشاذة في المتغير التابع باستخدام بواقي ستيودنت المحذوفة وطريقة الرسم الصندوقي، وكذلك تم الكشف عن القيم الشاذة في المتغيرات المستقلة بطريقة الرسم الصندوقي Box plot، وطريقة عناصر قطر المصفوفة Hat Matrix، وطريقة رسم وتحليل البواقيResidual Plot، وطريقة مسافة Mahalanobis . أما القيم الشاذة المؤثرة تم الكشف عنها باستخدام الطرق DIFFITS ، COOKS، COVRATIO، وتم معالجة القيم الشاذة بأسلوب التحويل اللوغاريتمي وطريقة الحذف وإعادة التقدير. ولتحقيق أهداف هذه الدراسة تم إجراء نوعين من الدراسة التطبيقية هما:
التطبيق الأول: تم استعمال مجموعة من البيانات الحقيقية متمثلة بالعوامل المؤثرة على الناتج المحلي الإجمالي للعراق والدول المجاورة له للفترة منذ (2004-2017). وهذه العوامل هي: )الدخل القومي الإجمالي، وإجمالي الاستهلاك، وعدد السكان).
والتطبيق الثاني: لبيانات غير طبيعية (Non Normal)، وبالتحديد يتبع المتغير التابع توزيع جاما متمثلة بربحية البنوك لبعض المصارف في دولة العراق وعلاقتها بمؤشرات تقييم الأداء المالي.
ومن أهم النتائج التي توصلت إليها الدراسة: أن للقيم الشاذة تأثير على المعلمات المقدرة لنماذج البانل الثلاثة؛ حيث تعمل على تضخم قيمة الأخطاء، وتقلل من قيمة F ، ومعامل التحديد R^2، حيث كانت قيم معامل التحديد صغيرة لنماذج البانل، وبعد معالجة القيم الشاذة ارتفعت قيمة معامل التحديد، وأصبح التقدير أكثر دقة من التي تم الحصول عليها بوجود القيم الشاذة. كما استنتج الباحث أن أفضل نموذج ملائم لهذه البيانات هو النموذج التجميعي PRM، كذلك إن وجود القيم الشاذة في نموذج البانل يؤثر على عدم تحقق فرضية التوزيع الطبيعي، كما تبين أن المتغيرات االمستقلة (الدخل القومي الإجمالي، إجمالي الاستهلاك) تؤثر بشكل معنوي على متغير الاستجابة (التابع) في البيانات المستخدمة في التطبيق العملي الأول.
وتوصلت الدراسة إلى وجود تأثير معنوي للمتغيرات االمستقلة (التفسيرية) في النوع الثاني من البيانات (مؤشر إجمالي الإيرادات إلى إجمالي الأصول، ومؤشر صافي الدخل الى رأس المال) على المتغير التابع (الربحية).
وأوصت الدراسة بعدة توصيات، أهمها: ضرورة تشخيص وتقليل أثرها من خلال معالجتها عند تطبيق نماذج البانل للحصول على نموذج أفضل، وضرورة الكشف عن القيم الشاذة لنماذج بيانات البانل ونماذج الانحدار الأخرى قبل استخدامها، خصوصا في الدراسات الاقتصادية والطبية.
يعد نموذج الانحدار الخطي من الأساليب الإحصائية المهمة كثيرة الاستخدام؛ لكونه يمثل العلاقة بين المتغيرات المستقلة والمتغير التابع بشكل معادلة، ومن خلال تقدير معلماتها يتم تحديد أهمية العلاقة وقوتها واتجاهها؛ مما يساعد ذلك على التخطيط واتخاذ القرارات الصائبة. ويعد نماذج البانل(Panel Data Models) بين أهم نماذج الانحدار التي ظهرت في الأونة الأخيرة بشكل كبير، ونالت اهتماما كبيرا؛ نظرا لأنها تأخذ بعين الاعتبار أثر الزمن (السلسلة الزمنية)، فضلا عن أثر الاختلاف بين الوحدات المقطعية التي قد تكون عبارة عن دول أو مدن أو شركات مختلفة.
إن تحليل نماذج البانل يكون أكثر ملاءمة من تحليل البيانات الزمنية بمفردها أو البيانات المقطعية بمفردها؛ نظرا لأنها تتضمن محتوى معلوماتي أكثر فيما لو تم استخدام البيانات المقطعية لوحدها أو السلاسل الزمنية؛ وبالتالي يمكننا الحصول على تقديرات ذات ثقة أعلى، كما أن مشكلة الارتباط المشترك بين المتغيرات تكون أقل حدة من بيانات السلاسل الزمنية.
تتميز بيانات البانل عن تحليل الانحدار الخطي بعدد أكبر من درجات الحرية مما يؤثر إيجابيا على دقة المقدرات. كما تعد طريقة المربعات الصغرى ((Ordinary Least Square من أكثر طرق التقدير شيوعا في تقدير معلمات نموذج الانحدار الخطي المتعدد لما لها من خصائص ومميزات تميزها عن طرق التقدير الآخرى، وتعتمد كفاءة التقدير وفق طريقة المربعات الصغرى على شروط معروفة يجب توفرها في بيانات الظاهرة المدروسة، وتعد طبيعة البيانات المدروسة من أبرز المشاكل التي تؤثر على نتائج التقديرات، إلا إنه رغم الأهمية لهذه البيانات فإن وجود القيم الشاذة ضمن مجموعة من البيانات يؤثر بشكل كبير على نتائج التحليل الإحصائى للبيانات؛ وهذا ما يشكل مبحثا رئيسيا في دراستنا.
ومن هنا تظهر أهمية تشخيص القيم الشاذة كخطوة أولى ومهمة فى عملية التحليل واتخاذ القرار؛ لذا فإن تشخيص القيم الشاذة يمثل واحدا من الأهداف العامة فى عملية تحليل البيانات وتعد معالجة القيم الشاذة بعد تشخيصها لإنهاء أثرها وإعادتها للبيانات كقيم بديلة خطوة ثانية ومهمة فى عملية تحليل البيانات لتطبيق التحليل الإحصائى المناسب، وله تأثير على دقة التحليل، لذا من الأفضل معرفة القيم الشاذة في هذه البيانات لكونها ستؤدي إلى تشخيصها ومعرفة أسبابها ثم علاجها.
تسلط هذه الدراسة الضوء على مشكلة وجود القيم الشاذة في بيانات البانل(panel data) وكيفية اكتشافها، وقياس أثرها على تقديرات نماذج البانل، والنتائج المترتبة على وجود هذه القيم كالحصول على نتائج غير دقيقة. وسنسعى إلى إيجاد حلول لمشكلة القيم الشاذة وإعادة تقدير النماذج ومعرفة النتائج.
2.1 مشكلة الدراسة The problem of the Study
تكمن مشكلة البحث في إن مسألة تعدد الوحدات المدروسة (الوحدات المقطعية) الممتدة لفترات زمنية مختلفة، كما هو الحال في بيانات القطاعات (Cross Section) مع السلاسل الزمنية (Time Series) يؤثر على تحليل الانحدار والمتغيرات المؤثرة فيها؛ وقد يؤدي ذلك إلى فشل الطرائق التقليدية كطريقة المربعات الصغرى ((Ordinary Least Square في تقدير معلمات نموذج الانحدار الخطي المتعدد الذي يصف الظاهرة المدروسة؛ بسبب ظهور الكثير من المشاكل والعقبات في ذلك النوع من البيانات كـ: مشكلة عدم تجانس تباين حد الخطأ (Heteroscedasticity)، أو مشكلة التعدد الخطي(Multicollinearity)، فضلا عن مسألة وجود مشاهدات أو قيم شاذة ومتطرفة في تلك البيانات يؤدي الى أخطاء في عملية التقدير حيث انها قد تؤدي الى تضخم تباين الاخطاء، مما يؤدي الى اتساع فترات الثقة وتقليل كفاءة التقدير.
هذا يعني أن هذا النوع من البيانات يتصف بتأثير مقطعي وزمني فضلا عن احتوائها على قيم شاذة (Outliers)، لذلك يتم اللجوء إلى بعض الطرق والأساليب في تحديد تأثير تلك القيم الشاذة، إضافة إلى استعمال طرق تقدير أخرى، وهي: طرق تقدير نموذج البانل لبيانات تتصف بتأثير مقطعي وزمني بعد معالجة تأثير القيم الشاذة وذلك للحصول على تقديرات دقيقة وكفء لمعلمات نموذج البانل.
3.1 هدف الدراسة: Aim of the Study
الأهداف الأساسية للدراسة
التعرف على نماذج البانل ومميزاته وطرق تقدير هذه النماذج، واختيار النموذج الأكثر ملاءمة لبيانات الدراسة من بين النماذج أعلاه من خلال اختبارات تحديد النموذج الملائم مثل: اختبار مضاعف لاكرانج واختبار هوسمان.
توضيح مفهوم وطرق اكتشاف وتشخيص القيم الشاذة وتأثيرها على تقديرات نماذج البانل المختلفة في تحليل الانحدار الخطي المتعدد للبيانات المقطعية الممتدة لفترات زمنية (بيانات العوامل المؤثرة على الناتج المحلي الإجمالي في العراق والدول المجاورة للفترة (2004-2017)م.
توضيح مفهوم الانحدار الخطي المعمم لبيانات البانل من نوع انحدار بيتا وانحدار جاما وتطبيق بيانات حقيقية ( ربحية البنوك وعلاقتها بمؤشرات الأداء المالي ) لمجموعة من المصارف العراقية للفترة ( 2009- 2018(م
التعرف على طرق وأساليب معالجة القيم الشاذة، ومن ثم استخدام أثنين من هذه الطرق (أسلوب التحويل اللوغاريتمي البيانات واسلوب الحذف وإعادة التقدير).
تقدير معلمات نموذج بيانات البانل الملائم لبيانات بيانات العوامل المؤثرة على الناتج المحلي الإجمالي في العراق والدول المجاورة له للفترة منذ (2004-2017) بعد معالجة القيم الشاذة.
4.1 خطة الدراسة Plan of the Study
يحتوي البحث مع المقدمة خمسة فصول تمثل متن البحث وصولاً إلى الخاتمة التى تتضمن أهم النتائج والتوصيات التى توصل إليها الباحث. وفيما يلى تفصيل ذلك على النحو التالى:
الفصل الأول: يتضمن الإطار العام للدراسة المتمثل بالمقدمة, ومشكلة وأهداف، والمنهجية المتبعة فى البحث الدراسة، والاستعراض المرجعي من خلال الدراسات السابقة، وتقديم بعض المفاهيم الأساسية التي استخدمت في هذه الدراسة.
الفصل الثاني: ويتضمن جزء من الجانب النظري حيث يعرض مقدمة عن بيانات البانل ((Panel data، ونماذج البانل الثلاثة، وهي: نموذج الانحدار التجميعي (Pooled Regression Model)، ونموذج التأثيرات الثابتة Fixed Effects Model))، ونموذج التأثيرات العشوائية (Random Effects Model )، وكذلك أساليب اختيار النموذج بين النماذج الثلاثة من خلال اختبار لاكرانج (Lagrange multiplier Test) (LM)، واختبار هوسمان (Hausman Test). كما سوف يتم عرض مفهوم النموذج الخطي المعمم, وحالات خاصة منه (نموذج انحدار بينا, نموذج انحدار جاما) .
الفصل الثالث: يمثل هذا الفصل المحور الآخير من الجانب النظري، ويتضمن القيم الشاذة ) Outliers ) تعريفها وأنواعها، وطرق اكتشافها في المتغيرات المستقلة والمتغير