الفهرس | Only 14 pages are availabe for public view |
Abstract تشير البيانات الكبيرة (Big Data) إلى مجموعة ضخمة من مجموعات البيانات من مصادر متنوعة في مجموعة البيانات المنظمة وشبه المنظمة وغير المنظمة. تواجه تكامل هذه البيانات العديد من المشاكل مثل التجانس والبنية الدلالية حيث أن معالجة هذه البيانات أمر صعب باستخدام قواعد البيانات والتقنيات البرمجية التقليدية. هناك انتقال من عصر ”البيانات على الإنترنت” إلى عصر ”شبكة البيانات (البيانات المرتبطة)” . (Linked data) تعتمد البيانات المرتبطة على بعض تقنيات الويب الدلالية لتوصيل البيانات بين مصادر البيانات المختلفة. توفر الويب الدلالي(Semantic Web) معلومات للإنسان بالإضافة إلى أجهزة الكمبيوتر للحفاظ على البيانات على نطاق واسع من الناحية اللغوية وتوفير محتوى ذات معنى للبيانات غير المهيكلة و تقديم فوائد جديدة لبحوث وتطبيقات البيانات الكبيرة. في السابق، في العديد من الدراسات، لا تزال البيانات الكبيرة تواجه العديد من التحديات التقنية. علاوة على ذلك، نظرًا لخصائص البيانات الكبيرة، هناك العديد من المشكلات التي تحدث في الدمج والتجميع والأمن والتمثيل والتفسير وغيرها. المساهمة الرئيسية لهذه الرسالة هو تجميع البيانات وتمثيلها كبيانات مرتبطة حيث نقترح نموذج ETL الدلالي الذي يستخدم بعض التقنيات الدلالية. في البداية، يتم تجميع البيانات الجغرافية من مصادر مختلفة على الويب يليها استخدام نموذج ETL الدلالي المبنى على الانطولوجي (Ontology) لتحويل هذه البيانات إلى تنسيق RDF. يستخدم تنسيق RDF لربط هذه البيانات بنجاح التكامل، وبالتالي بناء نموذج دلالي كبير لتخزين هذه البيانات. أظهرت النتائج التجريبية أن النظام المقترح حل لمشاكل تكرار الأعمدة التي تنتج من عدم التجانس الدلالي ومشكلة عدم التجانس الهيكلي في مختلف مصادر البيانات المنظمة وشبه المهيكلة. المساهمة الثانيىة لهذه الرسالة تتمثل فى تقديم عمل تدفق (Workflow)لتحسين نظام ETL الدلالي لدمج، ربط، وتمثيل جميع أشكال البيانات ”منظمة، شبه منظمة، أو غير منظمة”. يتم تجمع البيانات من مصادر مختلفة على شبكة الإنترنت. ومن ثم، تحويلها إلى ملف RDF وفقًا لتنسيق البيانات المجمعة. تستخدم البيانات الجغرافية المكانية كدراسة حالة لأن تكاملها معقد وعادة ما تعاني من تنوع الموارد وتمثيل البيانات الكبيرة المنتجة. أظهرت النتائج التجريبية أن النظام االمقترح المبنى على نموذج ETL الدلالي حل كل من مشاكل تكرار الأعمدة التي تنتج من عدم التجانس الدلالي ومشكلة عدم التجانس الهيكلي في مختلف مصادر البيانات المهيكلة وشبه المهيكلة وغير المنظمة. ايضا أظهرت النتائج ان استخدام عمل تدفق (Workflow)لتحسين نظام ETL الدلالي حل مشكلة عدم التجانس في العديد من مصادر البيانات ويحسن تكامل البيانات وتمثيلها. |