Search In this Thesis
   Search In this Thesis  
العنوان
تقدير نموذج الانحدار شبة المعلمي عند وجود ارتباط ذاتي /
المؤلف
البياتي، مصطفي هيثم سلطان.
هيئة الاعداد
باحث / مصطفي هيثم سلطان البياتي
مشرف / زهدي محمد نوفل
مشرف / صلاح مهدي محمد
مناقش / محمد زايد الدسوقي
الموضوع
الإحصاء الرياضي.
تاريخ النشر
2019.
عدد الصفحات
135 ص. :
اللغة
العربية
الدرجة
ماجستير
التخصص
الإدارة والأعمال الدولية
تاريخ الإجازة
1/1/2019
مكان الإجازة
جامعة بنها - كلية التجارة - الاحصاء
الفهرس
يوجد فقط 14 صفحة متاحة للعرض العام

from 123

from 123

المستخلص

يلقى موضوع نماذج الانحدار شبه المعلمية، الذي يدمج النماذج المعلمية والنماذج اللامعلمية، اهتماماً واضحاً في معظم الدراسات التي تأخذ طابعاً أكثر تقدماً في عملية التحليل الإحصائي الدقيق الهادف للحصول على مقدرات ذات مستوى عال من الكفاءة.
وفي هذا البحث, تم عرض بعض الطرق شبه المعلمية لمعالجة مشكلة الارتباط الذاتي بين الأخطاء العشوائية, معتمدين على نموذج خطي جزئي شبه معلمي والذي يحتوي على جزأين: أحدهما معلمي، والآخر لا معلمي، تم تقدير الجزء المعلمي باستعمال طريقة مقدر المربعات الصغرى العامة شيه المعلمية (Semiparametric Generalized Least Squares)، وطريقة مقدر البواقي المزدوجة (Double Residual)، وطريقة الفروق العامة (Generalized difference-based) متضمنة طريقة مقدر ليو (Liu) المسندة إلى الفروق العامة، وطريقة مقدر الحرف (Ridge) المسندة الى الفروق العامة, وطريقة مقدر نيووي - ويست (Newey – West) المسندة إلى الفروق.
أما النموذج اللامعلمي فقد تم تقديرهُ باستعمال مقدر ناداريا - واتسون (Nadaraya-Watson)، ومقدر الشرائح التمهيدية (Smoothing Spline). وإن أهم ما يهدف إليهِ البحث هو الحصول على أفضل مقدر لتقدير الجزء المعلمي بوجود مشكلة الارتباط الذاتي بين الأخطاء العشوائية، وكذلك الحصول على أفضل مقدر لتقدير الجزء اللامعلمي، وبيان أفضل نموذج انحدار خطي جزئي شبه معلمي (أفضل مقدر معلمي مع افضل مقدر لا معلمي) معتمدين بذلك على معيار متوسط مربعات الخطأ (MSE).
ولتحقيق هذه الأهداف, فقد تم إجراء نوعين من الدراسات التطبيقية: التطبيق الأول: تم فيهِ استعمال أسلوب المحاكاة للمقارنة بين طرق التقدير المدروسة لعدد كبير جداً من الحالات, وكانت أهم الاستنتاجات أن أفضل نموذج انحدار خطي جزئي شبه معلمي تم الحصول عليه عند استعمال مقدر المربعات الصغرى العامة شيه المعلمية لتقدير الجزء المعلمي مع مقدر الشرائح التمهيدية لتقدير الجزء اللامعلمي.
وفي التطبيق الثاني تم استعمال مجموعة من البيانات الحقيقية متمثلة بالناتج المحلي الإجمالي في العراق، وأهم العوامل المؤثرة عليه للفترة (1973-2014)م؛ وذلك للتحقق من أداء طرق التقدير المستخدمة في الواقع العملي, واستنتجنا أن أفضل نموذج انحدار خطي جزئي شبه معلمي تم الحصول عليه عند استعمال مقدر نيووي - ويست المسند إلى الفروق لتقدير الجزء المعلمي مع مقدر الشرائح التمهيدية لتقدير الجزء اللامعلمي.
إن التقدم العلمي في كافة المجالات والاختصاصات في عصرنا الحالي تطلب أن يقابلهُ تطوراً في علم الإحصاء, هذا العلم الذي يطوع كافة نظرياتهُ لخدمة العلوم الاخرى سوآءاً أكانت علمية أم اجتماعية أم انسانية... وغيرها من العلوم؛ لأنها تعتمد على جمع البيانات وتبويبها وتحليلها للوصول إلى النتائج المطلوبة.
كما أن فلسفة الإحصاء تكمن من حيث آلية التطبيق في محاولة نمذجة الحالات المختلفة بنماذج (Models) تكون أقرب ما يمكن إلى الواقع الحقيقي, وتُقاس درجة قوة هذه النماذج بحسب درجة تقاربها مع الخواص الاستدلالية الإحصائية. وهذه النماذج على أشكال مختلفة، فمنها: الاحتمالي التى تعتمد في صياغتها على الاحتمالات الصرفة، ومنها النماذج السببية التي تُصاغ نماذجها على ما يعرف بالسبب ونتيجتهُ. وتأتي في مقدمة هذه النماذج ما يُعْرَف بنماذج الانحدار(Regression Models) التي تقوم بتفسير العلاقة بين السبب الذي يُعرف إحصائياً بالمتغيرات التفسيرية(Explanatory Variables) وبين نتيجتهُ أو ما يُعرف بمتغير الاستجابة (Response Variable).
ويمكن تصنيف أنواع نماذج الانحدار إلى ثلاثة أنواع أساسية، هى: نماذج الانحدار المعلمي، ونماذج الانحدار اللامعلمي، ونماذج الانحدار شبه المعلمي، ولكل منها مميزاتها.
نماذج الانحدار المعلميَّة (Parametric Regression Models (PR)): تستخدم هذهِ النماذج لدراسة العلاقة بين متغيرين أو عدة متغيرات في حالة معرفة الشكل الرياضي لدالة الانحدار، ومعرفة التوزيع الاحتمالي للمتغيرات العشوائية (ε_i)، وغالباً ما يكون توزيع هذه الأخطاء توزيعاً طبيعياً بمتوسط (0) وتباين (σ^2). ويتميز نموذج (PR) بارتفاع درجة التقارب (Convergence Rates) بشرط أن يتم توصيفهُ توصيفاً سليماً, بينما أهم ما يعيبهُ مشاكل سوء التصنيف (Misspecification), كما يُعاب هذا النموذج بأنهُ يتأثر بالقيم الشاذة (لأن في تقدير قيم المعالم نستخدم جميع البيانات)، وكذلك يتأثر هذا النموذج في حالة وجود قيم مفقودة.
ومن أهم الأمثلة على نماذج الانحدار المعلميَّة ما يُسمى بنموذج الانحدار الخطي الذي يكون فيهِ متغير الاستجابة دالة خطية في المتغيرات التفسيرية إضافة الى المتغيرات العشوائية (ε_i). وقد بُني هذا النموذج على أساس مجموعة من الفروض، منها: أن يكون الشكل الرياضي لدالة الانحدار معلوم، وأن يكون التوزيع الاحتمالي للمتغيرات العشوائية(ε_i) معلوماً أيضاً, وأن تكون المتغيرات العشوائية مستقلة عن بعضها (لا يوجد ارتباط ذاتي بين الأخطاء), كما يفترض أن تكون المتغيرات التفسيرية متغيرات غير عشوائية.
إن تعقد الظواهر وتشعبها وعدم توفر معلومات كافية عنها، كأن تكون الظاهرة تحدث لأول مرة, أو ظاهرة لا يمكن تحديد العلاقة السببية أو السلوكية التي تربط المتغيرات، ولا توجد هناك أية فرضية تحكم العلاقة بين متغير الاستجابة والمتغير التفسيري، ولا يمكن تحديد أية علاقة سواءً أكانت خطية أم غير خطية؛ يؤدي إلى الحاجة فى التحرر من استعمال شكل داليِّ يقوم بوصف الظاهرة بشكل مسبق، واستعمال أسلوب آخر يكون أكثر مرونة في التعامل مع البيانات، وهو ما يُطلق عليهِ بنماذج الانحدار اللامعلمي.
نماذج الانحدار اللامعلمي (NPR)) :(Nonparametric Regression Models هذهِ النماذج لا يعتمد على القيود المفروضة في الانحدار المعلمي؛ ولذلك اكتسبت في السنوات الأخيرة استعمالات واسعة كأداة بديلة عن النماذج المعلمية؛ لأنها يمكن أن تستخدم في الحالات التي لا تتوفر فيها معلومات أو في الحالات التي تكون فيها المعلومات المتوفرة غير دقيقة، أي عندما يكون الشكل الرياضي الذي يُعبر عن العلاقة بين المتغيرات التفسيرية ومتغير الاستجابة غير معلوم, ويكون التوزيع الاحتمالي للمتغيرات العشوائية (ε_i) غير معلوم أيضاً؛ ولذلك تُسمى الطرق اللامعلمية بطرق التوزيع الحر free distribution)).
ويتميز نموذج (NPR) بمرونتهُ العالية في التعامل مع الأشكال المختلفة للبيانات مقارنة مع نموذج (PR) لكونهُ لا يفترض تبعية البيانات لتوزيع معين, كما يتميز بانهُ لا يعاني من مخاطر سوء التصنيف كما هو الحال في نماذج الانحدار المعلمية, فضلا عن كونهُ يستخدم سواءً أكانت المعلومات متوفرة أو غير متوفرة, وإنهُ يُقدم مقدرات متسقة، ويمكن أن يستعمل في حالة كون البيانات تتضمن اتجاهات غير واضحة (متزايدة أو متناقصة), كما يتميز بسهولة استخدامهُ في حالة كون البيانات المراد تحليلها على هيئة رتب, بالإضافة إلى أنهُ لا يتأثر بالقيم الشاذة, ولا بالقيم المتطرفة, ؛لأن المشاهدات القريبة جداُ من نقطة معينة ولتكن t هي المستخدمة في تقدير دالة الانحدار وليس جميع المشاهدات، وكذلك يتميز بأنهُ لا يتأثر في حالة كون للبيانات تحتوي قيم مفقودة.
وإن أهم ما يُعيب نموذج ((NPR أنهُ يعاني من مشكلة تزايد الأبعاد(Curse of Dimensionality) الناتجة عند زيادة عدد المتغيرات التفسيرية؛ وتؤدي هذه المشكلة إلى تدني في دقة التقديرات, كما أنهُ قد يُقدِّم مقدرات متحيزة. ومن أهم الأمثلة على نماذج الانحدار اللامعلمية ما يُدعى بنموذج الانحدار اللامعلمي البسيط, وهو حالة خاصة من نموذج الانحدار اللامعلمي العام الذي يتكون من متغير تفسيري واحد ((One explanatory، وغالباً ما يطلق على هذا النموذج بشكل الانتشار الممهد؛ وذلك لأنهُ في كثير من التطبيقات نتبع منحنى التمهيد خلال الانتشار لمتغير الاستجابة مقابل المتغير التفسيري.
إن نقطة الخلاف الرئيسية بين الانحدار المعلمي والانحدار اللامعلمي تكمن فى: إن الانحدار اللامعلمي لا يتقيد بشروط جازمة من حيث التوزيع الخاص بالخطأ ومتغير الاستجابة، ولا يتقيد بدالة معينة تفسر العلاقة بين المتغيرات التفسيرية ومتغير الاستجابة.
نماذج الانحدار شبه المعلمي ((SPR) :(Semiparametric Regression Modelsتعد هذه النماذج ثمرة التكامل بين نموذجي الانحدار المعلمي واللامعلمي، وتتميز بكونها تحتوي على كل المميزات الإيجابية التي يتضمنها النموذجان السابقان, وقد اقُترحت هذه النماذج من منطلق فكرة النماذج التجميعية حيث تمَّ الدمج بين النموذجين المعلمي واللامعلمي بنموذج شبه المعلمي الذي احتوى على القيود الصارمة في النموذج المعلمي ومرونتهُ الكاملة في النموذج اللامعلمي، كما يتميز بمرونتهُ العالية في التطبيق مقارنة مع النماذج المعلمية، كما أنهُ يتخلص من مشكلة تعدد الأبعاد التي تعاني منها النماذج اللامعلمية عند زيادة عدد المتغيرات التفسيرية.
ويستخدم نموذج SPR)) الذي يمثل الحالة الوسطية بين نموذج ((PR ونموذج NPR)) لدراسة العلاقة بين متغير الاستجابة والمتغيرات التفسيرية عندما تكون الصيغة الرياضية للعلاقة بين متغير الاستجابة وواحد أو أكثر من المتغيرات التفسيرية معلومة، ويوجد متغير تفسيري على الأقل يكون الشكل الرياضي للعلاقة بينهُ وبين متغير الاستجابة غير معلومة. ومن أهم الأمثلة على نماذج الانحدار شبه المعلمية ما يسمى بنموذج الانحدار الخطي الجزئي شبه المعلمي (Partial Linear Regression Model (PLM)) ، والذي يتكون من جزئين: جزء معلمي خطي (العلاقة بين متغير الاستجابة وبعض المتغيرات التفسيرية هي علاقة خطية)، وجزء لا معلمي (العلاقة بين متغير الاستجابة وباقي المتغيرات التفسيرية هي علاقة غير معلومة)، وترتبط هذه الأجزاء مع بعضها بعلاقة تجميعية.
بعد استعراض أنواع نماذج الانحدار, نأتي لبيان الهدف الأسمى من التطبيقات العلمية للتقدير؛ فالهدف الأساس لأي عملية تقدير يكمن فى الوصول إلى أفضل مقدر من بين كل المقدرات الممكنة؛ ولذلك يجب اختيار الأسلوب الأمثل أو الصيغة الأفضل لتقدير المعالم المجهولة؛ إذ إن تقدير معالم أي نموذج انحدار هو توضيح (تفسير) العلاقة بين متغير الاستجابة وعدة متغيرات تفسيرية بصيغة رياضية. وهناك طرق مختلفة لتقدير معالم نموذج ((PLM، وتنوع هذه الطرق يعتمد على كونهُ لا يعاني من أية مشاكل، أو يعاني من مشكلة كعدم تجانس التباين (Heteroscedasticity), مشكلة الارتباط الذاتي ((Autocorrelation, مشكلة التعدد الخطي (Multicollinearity)، مشكلة البيانات المفقودة (Missing data). إذ إن عملية التقدير تختلف من حال إلى أخرى تبعاً لوجود أو عدم وجود تلك المشاكل.
وفي هذا البحث سيتم التطرق إلى تقدير نموذج (PLM) بوجود مشكلة الارتباط الذاتي بين الأخطاء العشوائية من الدرجة الأولى AR(1) المخالفة لأحد فروض نموذج الانحدار المعلمي الذي ينص على: (إن القيم المختلفة للمتغير العشوائي تكون مستقلة عن بعضها). وتعد مشكلة (AR) من المشاكل القائمة الوجود في أغلب الدراسات التي تأخذ شكل السلاسل الزمنية (Time Series Data)، وكذلك البحوث التي تعتمد على بيانات مقطعية (Cross-Section Data)، وإن وجودها لهُ تأثيرات على مقدرات وتباينات المعالم المحسوبة بطريقة المربعات الصغرى الاعتيادية (OLS)؛ لذا استوجب تفادي هذه المشكلة، ووضع الحلول المناسبة لها.
1.2 مشكلة البحث The Problem of the research
تكمن مشكلة البحث في تقدير نموذج PLM)) بوجود مشكلة AR(1) المخالفة لأحد الفروض الخاصة بالجزء المعلمي الذي ينص على: (إن القيم المختلفة للمتغير العشوائي (ε_i) تكون مستقلة عن بعضها, أو بعبارة أخرى: إن قيمة المتغير العشوائي في أي فترة لا تعتمد على قيمتهُ في فترة أخرى)، أي أن:
〖Cov(ε〗_i ε_j)=E(ε_i 〖 ε〗_j) ≠ 0 ∀ i≠j i,j=1,2,…,n
إذ يعتمد نموذج (PLM) على الافتراضات التي تتعلق بالجزء المعلمي والجزء اللامعلمي، وفي حالة عدم تحقق فرض استقلالية الأخطاء العشوائية، والذي هو أحد فروض الجزء المعلمي، فإن هذا النموذج سيعاني من مشكلة الارتباط الذاتي بين الأخطاء(The Problem Of Autocorrelation Between Errors)، والتي تجعل عملية التقدير خاطئة أو في بعض الأحيان غير ممكنة؛ ولذلك سيتم التطرق في هذا البحث على طرق معالجة مشكلة AR(1) في نموذج ((PLM.
1.3 هدف البحث The Purpose of the research
يهدف البحث إلى تسليط الضوء على طرق متعلقة بمعالجة مشكلة AR(1) في نماذج ((SPR معتمدين بذلك على نموذج (PLM), إذ يتم معالجة هذه المشكلة باستعمال طريقة المربعات الصغرى العامة شبه المعلمية (Semiparametric Generalized Least Squares (SGLS))، وطريقة البواقي المزدوجة (Double Residual (DR))، وطريقة الفروق العامة (Generalized Difference-Based (GDB)) متضمنة طريقة ليو المسندة إلى الفروق العامة (Generalized Difference-Based Liu (GDBL)), وطريقة الحرف المسندة إلى الفروق العامة (Generalized Difference-Based Ridge (GDBR)), وطريقة نيو وي - ويست المسندة إلى الفروق (Difference-Based Newey – West (DBNW)) لتقدير الجزء المعلمي من نموذج (PLM)، كذلك استعمال الطرق اللامعلمية المتمثلة بطريقة ناداريا واتسون (Nadaraya – Watson (N-W))، وطريقة الشرائح التمهيدية (Smoothing Spline (SS)) لتقدير الجزء اللامعلمي.
وأن أهم ما يركز عليهِ البحث هو إبراز المقارنة بين طرق معالجة AR(1)، وكذلك مقارنة الطرق اللامعلمية، وبيان أفضل نموذج (PLM) (أفضل طريقة معلمية مع أفضل طريقة لامعلمية) معتمدين بذلك على معيار متوسط مربعات الخطأ ((MSE.
1.4 خطة البحث The Plan of the research
لغرض عرض موضوع البحث ومن ثم الوصول إلى الأهداف المرجوة، قسَّم الباحث هذهِ الرسالة العلمية إلى خمسة فصول، هى:
الفصل الأول: ”الإطار العام للبحث”
تضمن هذا الفصل مقدمة عامة للبحث، وعرض مشكلة البحث، وبيان هدفهُ، وخطة البحث مع نبذة تاريخية عن بعض البحوث ذات العلاقة بالدراسة.
الفصل الثاني” ”الجانب النظـري”
وتضمن عرض مشكلة (AR) وكذلك عرض نموذج PLM))، وطرق تقديرهُ بوجود هذه المشكلة.
الفصل الثالث: ”الجانب التجريبي”
وتضمن عرض مفهوم المحاكاة، وكذلك وصف تجربة المحاكاة، وتلاها عرض النتائج التي تمَّ التوصل إليها، بعد ذلك تمَّ تفسير هذه النتائج.
الفصل الرابع: ”الجانب التطبيقي”
وتَضمن استعمال بيانات حقيقية للتحقق من أداء الطرق شبه المعلمية المستعملة في الواقع العملي من خلال دراسة العوامل المؤثرة على الناتج المحلي الإجمالي بالأسعار الثابتة في العراق للفترة من عام 1973 إلى عام 2014 م.