Search In this Thesis
   Search In this Thesis  
العنوان
نظام مقترح قائم على التنقيب في البيانات لتحسين دقة تلخيص النصوص العربية /
الناشر
أسماء عوض عبدالقادر بيلي،
المؤلف
بيلي، أسماء عوض عبدالقادر.
هيئة الاعداد
باحث / أسماء عوض عبد القادر بيلي
مشرف / أماني فوزي محمد بدوي
مشرف / أحمد عبد الغني السيد عويس
مناقش / محمد محمد عيسى
الموضوع
اللغة العربية. الحاسبات الالكترونية - برامج.
تاريخ النشر
2018.
عدد الصفحات
142 ص. :
اللغة
العربية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/9/2018
مكان الإجازة
جامعة دمياط - كلية التربية النوعية - إعداد معلم الحاسب الآلي
الفهرس
يوجد فقط 14 صفحة متاحة للعرض العام

from 161

from 161

المستخلص

يُعد التلخيص الآلي للنصوص العربية أحد المجالات الدراسية في اللغة العربية والتي مازالت قيد الدراسة، والتلخيص الآلي عبارة عن نص مختصر تم إنتاجه من واحد أو أكثر من النصوص (المستندات) بحيث يحتوي على أهم المعلومات من النص الأصلي، وفي مجال التلخيص الآلي يوجد نوعين للتلخيص هما: الملخصات الاستخراجية (Extraction)، الملخصات التجريدية (Abstraction)؛ إلا أن مجال التلخيص الآلي عادةً ما تسيطر عليه تقنيات التلخيص عن طريق الاستخراج، حيث يتم انتاج ملخص آلي يحتوي على أهم النصوص الموجودة بالنص الأصلي.
أهمية الدراسة: في هذه الدراسة تم اقتراح نموذج للتلخيص الآلي للنصوص العربية قائم على تقنيات التلخيص عن طريق الاستخراج، يتكون النظام المقترح من ثلاث مراحل رئيسية هي: تجهيز النص (The pre-processing phase)، المعالجة (The processing phase)، الملخص النهائي (The final summary phase).
هدفت هذه الدراسة إلى: اقتراح نموذج للتلخيص الآلي للنصوص العربية قائم على تقنيات التلخيص عن طريق الاستخراج، يتكون النظام المقترح من ثلاث مراحل رئيسية هي: تجهيز النص (The pre-processing phase)، المعالجة (The processing phase)، الملخص النهائي (The final summary phase).
تكونت عينة الدراسة من: مجموعة من المقالات تم تجميعها من موسوعة ويكيبيديا حيث تم اختيار عينة عشوائية مكونة من 33 مقالة مكتوبة باللغة العربية في عدة مجالات مختلفة مثل: علم الفلك، علم الأحياء، علم الكيمياء... الخ؛ كما تنوعت حجم المقالات بين مقالات طويلة تحتوي على ثلاث فقرات أو أكثر أو متوسطة تحتوي على فقرتين أو صغيرة تحتوي على فقرة واحدة.
نتائج الدراسة: جاءت درجة تقييم الخبراء البشريين للنظام المقترح (التلخيص الآلي) بشكل عام مناسبة، إذ بلغ المتوسط الحسابي لاستجابات المحكمين على الاستبيان في المحاور الأربعة (الشكل العام والمضمون، تماسك العبارات، عدم الإسهاب أو التكرار، اكتمال المعنى) ككل 80%. تم مقارنة النظام المقترح مع عدة نظم أخري لتلخيص النصوص؛ وأظهرت النتائج تفوق النظام المقترح في مقياس ROUGE، وتبين من استخدام النظام المقترح أن تقنيات التلخيص عن طريق الاستخراج يمكن من خلالها الحصول على أهم الجمل وبالتالي الحصول على ملخصات جيدة خاصة في المستندات صغيرة الحجم.