![]() | Only 14 pages are availabe for public view |
Abstract انتشرت المقالات العربية والأخبار والمستندات النصية العربية على صفحات الانترنت بشكل كبير في السنوات الأخيرة، وأصبحت عمليات البحث عن موضوع معين صعبة، مما ادى الى ضرورة العمل على انشاء تطبيقات تمكن المستفيدين من إجراء عمليات البحث خلال مجموعات كبيرة من المسندات العربية بشكل دقيق وسريع. يهدف هذا البحث الى تجميع النصوص العربية بشكل هرمي لتسهيل عمليات البحث خلال مجموعات المستندات النصية المتاحة بأشكال مختلفة. لتحقيق هذا الهدف قمنا فى هذه الرسالة بتقديم نهجا جديدا لا يختص بمجال معين ولا بقواعد بيانات بعينها لتمثيل المستندات النصية وتحديد التشابة بينهم. وذلك عن طريق استخراج الكلمات المفتاحية الهامة لكل مستند نصى وتحديد التشابة بين هذه الكلمات المفتاحية باستخدام طرق التشابة المختلفة النحوية والدلالية للحصول على تمثيل هرمى دقيق لكل مجموعة من المستندات النصية المتشابهة. تم اختبار النظام باكثر من طريقة من طرق التشابه النحوية والدلالية وذلك باستخدام قاعده بيانات مكونة من 345 مستند نصى عربى تم تجميعهم من مصادر مختلفة فى مجالات مختلفة. واوضحت النتائج مدى دقة النظام المقترح من حيث التمثيل باستخدام الكلمات المفتاحية للمستندات العربية وايضا عن طريق ايجاد التشابة اعتمادا على عدد الكلمات المفتاحية المشتركة بين المستندات. تتكون الرسالة من ستة أبواب كالتالي: الفصل الأول: يعرض مقدمة عن مشكلة البحث وأهدافه ، الفصل الثاني: يقدم عرض عن طرق استخراج الخصائص المميزة لتمثيل المستندات النصية ، وطرق تحديد التشابه بين محتواها. ، وأهميته ، وخطته، والإسهام العلمى له. الفصل الثالث: يقدم دراسة استقصائية عن الدراسات السابقة ذات الصلة ، وطرق التجميع بين محتوى المستندات النصية. الفصل الرابع: يوضح النظام المقترح للتجميع الهرمى للمستندات ، ويناقش مراحل النظام المقترح بالتفصيل مع التدعيم بالصور. الفصل الخامس: يعرض النتائج العملية التي تم الحصول عليها من تطبيق النظام المقترح ، وطرق تقييمها وتم أيضا تحليل النتائج ومناقشتها في هذا الباب ودعمها بجداول المقارنة مع طرق سابقة ذات صلة بموضوع البحث. الفصل السادس: يعرض أهم الاستنتاجات التي تم التوصل إليها ويقترح بعض الاتجاهات المستقبلية في هذا المجال. |