كيفية التعامل مع البيانات الملوثة غير تامة الرتبة ضمن بيانات متعدد المتغيرات

المؤلفون

  • لقاء علي محمد

DOI:

https://doi.org/10.55562/jrucs.v23i2.481

الكلمات المفتاحية:

البيانات الملوثة

الملخص

عندما نواجه بيانات بأبعاد عالية غالبا" ما نستخدم تحليل المركبات الرئيسية Principal Components Analysis (PCA) لتقليص تلك الابعاد. تحليل المركبات الرئيسية العادي (PCA) يكون مجموعة من المتغيرات غير المرتبطة التي تعود الى المتجهات الذاتية المشتقة في مصفوفة التباين المشترك او مصفوفة الارتباط. على كل حال من الجيد معرفة ان مصفوفة التباين المشترك هذه تتأثر بقوة بالمشاهدات المتطرفة لذلك من الضروري ان نضع طريقة حصينة تقاوم الشواذ المحتمل.Li & Chen (1985) قدموا حل يعتمد على ملاحقة البروز Projection Pursuit (PP) الفكرة هي البحث عن الاتجاه الذي فيه تكون المشاهدات البارزة Projected Observations تمتلك اكبر تباين حصين. في خطوات لاحقة كل اتجاه جديد سوف يهيكل كي يكون متعامد مع كل الاتجاهات السابقة. الطريقة وضعت جيدا" كل تتعامل مع بيانات الابعاد العالية حتى عندما يكون عدد المتغيرات (P) اكبر من عدد المشاهدات (n) او مايسمى بالبيانات غير تامة الرتبة او البيانات الناقصة. لهذا فان هذا البحث ينصب على دراسة البيانات الناقصة وخاصة عندما تحتوي مجموعة البيانات تلك على الملوثات او المشاهدات الشاذة ضمن مجموعة البيانات والوصول بعدها الى صورة معتدلة عن تلك البيانات نستطيع من خلالها تطبيق الخوارزميات الحصينة عليها مثل (R,M,S, …) وايجاد المقدرات الحصينة لها والمفاضلة فيما بينها ضمن مجموعة من المعايير.

التنزيلات

تنزيل البيانات ليس متاحًا بعد.

التنزيلات

منشور

2021-10-26

كيفية الاقتباس

كيفية التعامل مع البيانات الملوثة غير تامة الرتبة ضمن بيانات متعدد المتغيرات. (2021). مجلة كلية الرافدين الجامعة للعلوم ( 1681-6870 ), 23(2), 68-90. https://doi.org/10.55562/jrucs.v23i2.481