Search In this Thesis
   Search In this Thesis  
العنوان
Semantic web for big data improvement /
المؤلف
Abo arbaa, Abeer Saber Ahmed.
هيئة الاعداد
باحث / عبير صابر احمد ابو اربعه
مشرف / سمير الدسوقى الموجى
مشرف / أية محمد الزغبى
مناقش / سمير الدسوقى الموجى
الموضوع
Computer science. Big data. Ontology. Semantic heterogeneity. Semantic heterogeneity. Linked data. Semantic Web.
تاريخ النشر
2018.
عدد الصفحات
86 P. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/1/2018
مكان الإجازة
جامعة المنصورة - كلية الحاسبات والمعلومات - علوم الحاسب
الفهرس
Only 14 pages are availabe for public view

from 108

from 108

Abstract

تشير البيانات الكبيرة (Big Data) إلى مجموعة ضخمة من مجموعات البيانات من مصادر متنوعة في مجموعة البيانات المنظمة وشبه المنظمة وغير المنظمة. تواجه تكامل هذه البيانات العديد من المشاكل مثل التجانس والبنية الدلالية حيث أن معالجة هذه البيانات أمر صعب باستخدام قواعد البيانات والتقنيات البرمجية التقليدية. هناك انتقال من عصر ”البيانات على الإنترنت” إلى عصر ”شبكة البيانات (البيانات المرتبطة)” . (Linked data) تعتمد البيانات المرتبطة على بعض تقنيات الويب الدلالية لتوصيل البيانات بين مصادر البيانات المختلفة. توفر الويب الدلالي(Semantic Web) معلومات للإنسان بالإضافة إلى أجهزة الكمبيوتر للحفاظ على البيانات على نطاق واسع من الناحية اللغوية وتوفير محتوى ذات معنى للبيانات غير المهيكلة و تقديم فوائد جديدة لبحوث وتطبيقات البيانات الكبيرة. في السابق، في العديد من الدراسات، لا تزال البيانات الكبيرة تواجه العديد من التحديات التقنية. علاوة على ذلك، نظرًا لخصائص البيانات الكبيرة، هناك العديد من المشكلات التي تحدث في الدمج والتجميع والأمن والتمثيل والتفسير وغيرها. المساهمة الرئيسية لهذه الرسالة هو تجميع البيانات وتمثيلها كبيانات مرتبطة حيث نقترح نموذج ETL الدلالي الذي يستخدم بعض التقنيات الدلالية. في البداية، يتم تجميع البيانات الجغرافية من مصادر مختلفة على الويب يليها استخدام نموذج ETL الدلالي المبنى على الانطولوجي (Ontology) لتحويل هذه البيانات إلى تنسيق RDF. يستخدم تنسيق RDF لربط هذه البيانات بنجاح التكامل، وبالتالي بناء نموذج دلالي كبير لتخزين هذه البيانات. أظهرت النتائج التجريبية أن النظام المقترح حل لمشاكل تكرار الأعمدة التي تنتج من عدم التجانس الدلالي ومشكلة عدم التجانس الهيكلي في مختلف مصادر البيانات المنظمة وشبه المهيكلة. المساهمة الثانيىة لهذه الرسالة تتمثل فى تقديم عمل تدفق (Workflow)لتحسين نظام ETL الدلالي لدمج، ربط، وتمثيل جميع أشكال البيانات ”منظمة، شبه منظمة، أو غير منظمة”. يتم تجمع البيانات من مصادر مختلفة على شبكة الإنترنت. ومن ثم، تحويلها إلى ملف RDF وفقًا لتنسيق البيانات المجمعة. تستخدم البيانات الجغرافية المكانية كدراسة حالة لأن تكاملها معقد وعادة ما تعاني من تنوع الموارد وتمثيل البيانات الكبيرة المنتجة. أظهرت النتائج التجريبية أن النظام االمقترح المبنى على نموذج ETL الدلالي حل كل من مشاكل تكرار الأعمدة التي تنتج من عدم التجانس الدلالي ومشكلة عدم التجانس الهيكلي في مختلف مصادر البيانات المهيكلة وشبه المهيكلة وغير المنظمة. ايضا أظهرت النتائج ان استخدام عمل تدفق (Workflow)لتحسين نظام ETL الدلالي حل مشكلة عدم التجانس في العديد من مصادر البيانات ويحسن تكامل البيانات وتمثيلها.