Search In this Thesis
   Search In this Thesis  
العنوان
Search engine using grid computing /
المؤلف
Moussa, Mohamed El-Sayed El-Arabi Mohamadi.
هيئة الاعداد
باحث / Mohamed El-Sayed El-Arabi Mohamadi Moussa
مشرف / Omaima .M. Nomir
مشرف / Mohamed Sakre
باحث / Mohamed El-Sayed El-Arabi Mohamadi Moussa
الموضوع
Grid Computing. Web Crawler. Web Pages Architecture. Page Ranking. Computational grids (Computer systems). (Electronic resource). Application software - Development.
تاريخ النشر
2013.
عدد الصفحات
115 p. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/1/2013
مكان الإجازة
جامعة المنصورة - كلية الحاسبات والمعلومات - Computer Science
الفهرس
Only 14 pages are availabe for public view

from 129

from 129

Abstract

هذه الرسالة تتعامل مع كل من الزاحف(Crawler) والمفهرس(Indexer) الخاصين بمحرك البحث على شبكة الأنترنت. من خلال هذه الرسالة تم اقتراح هيكل جديد للزاحف ، هذا الهيكل المقترح يعتمد فى تصميمه على استخدام الحوسبة الشبكية. حيث ان استخدام الحوسبة الشبكية يهدف إلى توزيع مجهود الزاحف على مجموعة من أجهزة الحاسب العادية وتهدف إلى زيادة عدد صفحات الويب التى يتم جمعها خلال نفس الوقت المستغرق بجهاز واحد ذو امكانيات عالية. هذه الرسالة تقترح ايضا تصميم جديد للمفهرس (Indexer) يعتمد على استخدام الحوسبة الشبكية. وهذا التصميم يعتمد على توزيع أحمال عملية الترتيب وتقليل الحاجة إلى أجهزة كمبيوتر ذو وحدات معالجة عالية ومساحات تخزين كبيرة جدا. التصميم المقترح يدعم الترتيب المتغير للتعامل مع التغييرات المستمرة فى محتوى الويب وتحديث صفحات الويب التى تم ترتيب محتواها سابقا فى محرك البحث.
التصميمات المقترحة للزاحف والمفهرس يعتمدان بطريقة رئيسية على الحوسبة الشبكية التى تقوم بالاستفاده من أجهزة الكمبيوتر المتاحة. ولا توجد حاجة لشراء أجهزة كمبيوتر أو خوادم كبيرة ومكلفة جدا، حيث المهام تقسم وتوزع على أجهزة صغيرة. تم دمج الزاحف والمفهرس معا لدعم تحديث وترتيب الكلمات المفتاحية للصفحات. الطريقة المستخدمة للتحديث مخطط لها اثناء تصميم الزاحف والمفهرس ، حيث ان هناك جزء من المفهرس مسئول عن تحديد الصفحات القديمة وارسالها إلى الزاحف ليسترجعها من الويب مرة اخرى ولتحديث النسخة القديمه.
وتتكون الرسالة من سبع فصول كالتالى
الفصــــل الأول : ويحتوى على مقدمة للرسالة ويقدم نظرة عامة عن محركات البحث ، ويستعرض المشكلة التى تعالجها هذه الرسالة والدوافع لها ، ويستعرض ايضا الاسهامات المقدمة فى هذه الرسالة وملخص لتنظيم باقى فصول الرسالة.
الفصل الثانى : عبارة عن مقدمة عن محركات البحث والحوسبة الشبكية ويعرض مقدمة عن الشبكة العنكبوتية واسترجاع المعلومات ومحركات البحث عبر الويب ومكونات محركات البحث ، ويقدم ايضا مقدمة عن الحوسبة الشبكية ومميزاتها وعيوبها وخوارزميات ادارة وجدولة المهام عبر الحوسبة الشبكية.
الفصل الثالث : عبارة عن الأعمال السابقة التى لها علاقة بموضوع البحث. هذا الفصل يعرض بعض الأطروحات التى تم نشرها فى الموضيع المذكورة فى هذه الرسالة ومن هذه الموضوعات محركات البحث بشكل عام والزواحف والمفهرسات وترتيب الصفحات و محركات البحث بمفهوم المعالجة الموزعة.
الفصل الرابع : يقترح تصميم جديد للزاحف (Crawler) باستخدام الحوسبة الشبكية. يبدأ هذا الفصل بعرض الخوارزم التقليدى للزاحف ومشاكل جدولة أعمال الزاحف ، ثم يقدم التصميم المقترح للزاحف المعتمد على الحوسبة الشبكية ، ويقدم التطبيق لهذا المقترح ويعرض النواتج والتقييم عند تشغيل الزاحف المقترح بفرده.
الفصل الخامس : يقترح تصميم جديد للمفهرس (Indexer) موزع ومتغير. هذا الفصل يبدأ بمقدمة عن المفهرس والترتيب المعكوس والترتيب الموزع والترتيب المتغير. يقدم هذا الفصل التصميم المقترح للمفهرس الموزع والمتغير معتمدا على استخدام الحوسبة الشبكية، وايضا يعرض كيفية تطبيق هذا التصميم المقترح والنتائج وتقييم تشغيل على مجموعة صفحات الويب التى تم جمعها بالزاحف المقترح من قبل.
الفصل السادس : يقدم اولا النموذج المعتاد لمحركات البحث، وأساليب التحديث، وأساليب ترتيب الصفحات ويعرض عمل الزاحف والمفهرس المقترحان معا وتكاملهم. حيث ان عند عمل الزاحف والمفهرس معا يدعمان عملية التحديث (Freshness) وايضا يدعمان طريقة ترتيب الصفحات (Page Ranking).
الفصـــل الســابع : نتناول فيه ملخصا للنظم التى قمنا باقتراحها و الأعمال التي تم انجازها في هذه الرسالة ، يعرض النتائج التى تم الوصول إليها. وتم تقديم وصف للاتجاهات المستقبلية الخاصة بهذا الرسالة.