Author: Algrbaa, Hanan Amar,/ Title: Speaker Recognition from Speech Signal using Machine Learning /

Search In this Thesis

العنوان

Speaker Recognition from Speech Signal using Machine Learning /

الناشر

Hanan Amar Algrbaa,

المؤلف

Algrbaa, Hanan Amar,

هيئة الاعداد

باحث / Hanan Amar Algrbaa

مشرف / Gamal Mohamed Behery Essa

مشرف / RedaElsaid Mohamed Elbarougy

مناقش / Kamal ELDahshan

الموضوع

Speech Signal.

تاريخ النشر

2017.

عدد الصفحات

122 p. :

اللغة

الإنجليزية

الدرجة

ماجستير

التخصص

الرياضيات الحاسوبية

تاريخ الإجازة

26/9/2017

مكان الإجازة

جامعة دمياط - كلية العلوم - الرياضيات

الفهرس

Only 14 pages are availabe for public view

Abstract

نظام التعرف على المتحدث هو العملية الاتوماتكية للتعرف على المتحدث من خلال صوته اعتمادا على معلومات
معينة داخل الصوت. ينقسم نظام التعرف على المتحدث الى نوعين، تحديد المتحدث والتحقق من المتحدث
تحديد المتحدث وهو تحديد الصوت (الموجة ) المعطاة يطابق أي متحدث من مجموعة من المتحدثين معروفة لدينا كقاعدة بيانات . وعملنا هدا يستند على هدا النوع.
التحقق من المتحدث هو عملية تحديد ما إذا كان الشخص الذي يتحدث هو نفس الشخص هو /هي.
وتنقسم عملية التعرف على المتحدث إلى عدة مراحل: استخراج ميزات ، اختيار الميزات،والتصنيف. ويمكن
عرض الملخص العربي لهدا العمل كما يلي:
الفصل الاول :المقدمة وفيه تم عرض مكونات الصوت وتوضيح النظام البشري لعملية انتاج الصوت عند المتحدث وعملية ادراكه عند المستمع ومن هدا النظام الطبيعي استطاع العلماء عمل نظام مشابه اتوماتيكي للتعرف على المتحدث يحاكي النظام السمعي للانسان.
الفصل الثاني :خلفية عامة عن نظام التعرف وفيه عرض شامل لتكنولوجية التعرف على المتحدث من اساسيات
نظام التعرف والتطبيقات التي استخدم فيها واستخراج الميزات وانواعها وطرق استخراجها الى عملية التصنيف التي بدورها تعطي التعرف على المتحدث واشهر الطرق المستخدمة في التصنيف.
الفصل الثالث: استخراج واختيار الميزات )1استخراج الميزات :هذه المرحلة مهمة جداً في عملية التعرف، وهي استخلاص سلسلة من الميزات التي توفر )2اختيار الميزات: بعد استخراج ميزات الكلام عادة هناك عدد كبير من الميزات، منها ماهو مكرر ومنها ما هو أقل فعالية لتمييز المتكلم، ولذلك ينبغي التخلص من الميزات المكررة أو الأقل فعالية. لذا نحن بحاجة إلى اختيار أو تقليل عدد هذه الميزات .
الفصل الرابع: التصنيف: التصنيف هو عملية تجميع الميزات المتشابه، بحيث يتم تجميع الميزات التي تتقاسم نفس الخصائص وتصنيفها كمجموعة . هناك العديد من النمادج المستخدمة في عملية التصنيف وتنقسم هذه النمادج الي نوعين :نمودج مراقب supervisedاي انه معلوم لدينا المدخلات والمخرجات.
الفصل الخامس : النظام المقترح في هذا الفصل تم اختيار قاعدة البيانات Berlin databaseوالتي اخترنا منها 200جملة لعشرة متحدثين، خمسة رجال وخمس نساء. عدد الجمل التي قرأها المتحدثين عشرة منها خمس جمل طويلة وخمس جمل قصيرة.
الفصل السادس : نتائج التجارب والمناقشة
وفي هذا الفصل تم تنفيد العديد من التجارب مع كلا النمودجين باستخدام ميزات MFCCالتقليدية و
MFCCالمحسنة حتى حصلنا على افضل نتائج وكانت النتائج مع MFCCالمحسنة افضل من النتائج مع MFCCالتقليدية ومن هنا تبين لنا كفأة النظام المقترح وفعاليته في التعرف على المتحدث.