Search In this Thesis
   Search In this Thesis  
العنوان
A Scientific Research Classification Approach for Identifying Author Specialty.
المؤلف
Elnagar, Sara Mohammed Abdelrahman Ibrahim Abdou.
هيئة الاعداد
باحث / Sara Mohammed Abdelrahman Ibrahim Abdou Elnagar
مشرف / Tarek Ahmed El-Shishtawy
مشرف / Walaa Mohammed Medhat
مناقش / Abdelwahab kamel alsammak
مناقش / Mazen mohammed selim
الموضوع
“Machine Learning. Data mining. Classification in Machine Learning.
تاريخ النشر
2021.
عدد الصفحات
85 p. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
Information Systems
تاريخ الإجازة
26/12/2021
مكان الإجازة
جامعة بنها - كلية الحاسبات والمعلومات - نظم معلومات
الفهرس
Only 14 pages are availabe for public view

from 95

from 95

Abstract

يواجه الباحثون وقراء المقالات العلمية في مجتمع البحث مشكلة تحديد فئات المقالات وأوراق البحث
العلمي. وهذا يؤدي إلى صعوبة في تحديد تخصصات المؤلفين. هناك أيضًا صعوبة في تصنيف المجلات العلمية.
تقدم العديد من الخبرات حلولاً للباحثين في تصنيف المقالات والمجلات. تهدف إلى تسهيل اختيار المجلات المناسبة
لنشر البحوث العلمية. ومع ذلك، فإن مشكلة تحديد تخصص الناشر او المؤلف وفقًا لأبحاثه العلمية لم يتطرق لها
إلا القليل من الأبحاث.
لذلك، تهدف الرسالة إلى تسهيل تحديد التخصص الرئيسي للمؤلفين بناءً على منشوراتهم. ك ما يقدم طريقة
لتصنيف المجلات العلمية وفقًا لنطاقات المجلات بناءً على تقنيات تصنيف النص.
تحتوي العديد من مواقع الويب على مجلات مصنفة وفقًا لفئات المعرفة مثل موقع Scimago . يقدم موقع
Scimago قائمة تضم 24 مجالًا علميًا رئيسيًا )الفئة الرئيسية( مثل الكيمياء وعلوم الحاسب وعلوم القرار وط ب
الأسنان ..... إلخ، وتضم 310 فئة فرعية من فروع المعرفة. على سبيل المثال فإن الفئة الرئيسية علوم الحاسب
تضم فئات فرعية مثل الذكاء الاصطناعي وتطبيقات علوم الحاسب ونظم المعلومات وشبكات الحاسوب
والاتصالات ..... إلخ. لقد استخدمنا هذا التصنيف المتاح في تجاربنا حيث تم تقسيم مجموعة البيانات إلى اثنين من
مجموعات البيانات: نطاقات المجلات وملخصات المقالات تم تجميعها من الفئات الرئيسية من موقع Scimago .
تتمثل المساهمة الرئيسية للرسا لة في بناء نظام مصنف لتحديد الفئة الرئيسية للمقالة ، وبالتالي تخصص
المؤلف. إلى جانب ذلك، يساعد النظام المقترح في تصنيف المجلات العلمية في جميع فروع المعرفة. وقد تم بناء
المصنف بتعديل طريقة TF-IDF . وبناء مجموعة كبيرة من البيانات التي تضم 9600 فقرة من نطاقات المجلات
وملخصات المجلات في مختلف فروع المعرفه والتي بلغ عددها 24 فرع من الفئات الرئيسية من موقع Scimago
، استخدم منها 80 % أثناء مرحلة بناء المصنف، والباقي تم استخدامهم في مرحلة الاختبارات. و قد تم إجراء عدة
تجارب لجميع فئات المعرفة ال 24 ، عكس الأعمال السابقة التي اعتمدت فقط على ثلاث أو اربع فئات. وقد كان
أهم التحديات التي واجهت المصنف هو أن العديد من فئات التصنيف قريبة جدًا من بعضها البعض، ولذلك كان من
الضروري إجراء تعديل على TF-IDF التقليدية لتحسين دقة التصنيف، مما يسهل تحديد الفئة الرئيسية للمقال
وبالتالي تحديد تخصص المؤلف او الناشر وأيضا تسهيل تصنيف المجلات لتسهيل اختيار المجلات المناسبة لنشر
الأبحاث العلمية. وبالتالي أصبحت نتائج التصنيف أعلى وأكثر دقة.
[2]
وقد أظهرت النتائج العلمية للطريقة المقترحة تحسنا كبيرا في نتائج التصنيف مقارنة بالنتائج السابقة. فقد
بلغت درجة دقة التصنيف 70 % لتصنيف المقالات والمؤلفين بينما تراوحت نتائج البحوث السابقة فى تصنيف
المقالات من 57.79 % إلى 64.28 %. وقد بلغت درجة دقة التصنيف 72 % لتصنيف المجلات، بينما كانت نتائج
البحوث السابقة في تصنيف المجلات 61 .%
محتويات الفصول
الفصل الأول: يقدم هذا الفصل مقدمة لتوضيح أساليب وتقنيات تصنيف النصوص والاسلوب المعدل
المقترح. يقدم أيضا هذا الفصل دوافع الرسالة. يعرض بطريقة واضحة المشكلة الرئيسية للرسالة والمصادر المعتمد
عليها في حل المشكلة والنتائج المطلوبة. يقدم أيضا لمحة عامة عن النظام المقترح. كما أنه يوضح أهداف الرسالة.
نهاية الفصل توضح ترتيب بقية فصول الرسالة .
الفصل الثاني: يعطي هذا الفصل مراجعة للأعمال السابقة. يقدم أيضا لمحة عامة عن التصنيف. ويناقش
أنواع التصنيف. كما أنه يوفر تعريفًا لتصنيف النص ويشرح ويراجع الخوارزميات المختلفة لتصنيف النص. أخيرًا،
يقدم مراجعة لاستخدام نموذج فضاء المتجه لتمثيل الوثائق في تصنيف النص.
الفصل الثالث: يقدم هذا الفصل لمحة عامة عن الأساليب والأدوات ذات الصلة، والتي تستخدم في هذه
الرسالة. يشرح خطوات المعالجة المسبقة للنصوص: إزالة علامات الترقيم والأرقام، والترميز، وإزالة كلمات
التوقف والكلمات الأكثر شيوعًا، والخطوة الأخيرة، وهي اعادة الكلمات للصيغة الاساسية. يقدم الفصل لمحة عامة
عن TF-IDF وطريقة حسابها وتشابه جيب التمام.
الفصل الرابع: يعرض هذا الفصل في البداية لمحة عن النظام المقترح. يوضح الفصل ويشرح كيفية
الحصول على مجموعات البيانات المستخدمة. أخيرًا، يقدم المفاهيم الأساسية والخطوات المطلوبة للنظام المقترح.
كما يوضح كيفية الاعتماد على كل مجموعه من مجموعات البيانات منفصلة والتجارب عل ى كل مجموعة من
مجموعات البيانات. يوضح خطوات تطبيق تشابه جيب التمام لتصنيف المؤلفين والمقالات وايضا لتصنيف
المجلات.
الفصل الخامس: يعرض هذا الفصل النتائج والمناقشات للنظام المقترح. والذي يتضمن العثور على نتائج
تصنيف المقالات ليتم من خلالها تحديد تخصص المؤلف او الناشر. تتم هذه التجربة عن طريق اختبار مجموعتين
من مجموعات البيانات وتحديد أي منهم يعطي نتائج أدق. يقدم أيضا مقارنة للنتائج مع الاعمال السابقة المعتمدة
[3]
على تصنيف المقالات. يقدم أيضا اختبار مجموعة بيانات نطاقات المجلات لإظهار مدى دقة تصنيف المجلة للفئة
الصحيحة. وأيضا يقدم مقارنة للنتائج مع الاعمال السابقة المعتمدة على تصنيف المجلات.
الفصل السادس: يستخلص الاستنتاجات والأعمال المستقبلية، ويختتم الأطروحة ويناقش الأعمال
المستقبلية في مجال تصنيف المقالات والمجلات.