Get Mystery Box with random crypto!

لو رجعنا لموضوع المعالجة المسبقة للبيانات Data Preprocessing و | Mohammed Eydan

لو رجعنا لموضوع المعالجة المسبقة للبيانات Data Preprocessing وبعد ما تكلمنا عن تنظيف البيانات ، خلي نتكلم عن تحويل البيانات Data Transformation .
ايضا هذي مجموعة من التقنيات تساعدنا نحول البيانات من صيغة الى اخرى او نغير بهيكلية البيانات Structure ، يعني شلون ؟
من اسمها تخيل يكون عندك بيانات صورية لحيوانات، مثلا صور وتريد تصنفها ،وممكن بعض هذي الصور متكون واضحة (مثل الصورة المرفقة)، فهنا نطبق عليها تقنيات تحويل البيانات حتى تكون اكثر وضوح وبالتالي التصنيف يكون دقته عالية .
ومثل ما قلنا سابقا هي مجموعة من التقنيات فأبرز هذي التقنيات هي :
١- تصفية او تنعيم البيانات Data Smoothing - يعني نتخلص من الضوضاء Noise التي بالبيانات مثل صورة الحيوانات اعلاه .
٢- بناء السمات Attributes Construction - يعني نحاول نبني سمات جديدة تسهل من عملية التعامل مع البيانات .
٣- تجميع البيانات Data Aggregation - بالاغلب تكون البيانات قادمة من عدة مصادر وبالتالي تتكرر فيها بعض البيانات وبالتالي نطبق عليها التجميع حتى يكون عندنا مختصر لهذي البيانات المكررة لان البيانات المكررة راح تزيد من حجم الداتا سيت وهذا راح يسبب بطىء بمرحلة تدريب النموذج (Model) .
٤- تطبيع البيانات Data Normalization - يعني اعادة تحجيم البيانات بحيث نصغرها .
٥- تقدير البيانات Data Discretization -هذي نقصد بيهم نجزء البيانات الى اجزاء حسب فترات معينة ، مثلا من كذا يوم لكذا يوم .
٦- تطبيق مفهوم الهرم Concept Hierarchy Generation -مشابه لفكرة التطبيع يعني مثلا عندنا الاعمار بدل ما ناخذهم كأرقام ممكن نستبدلهم ب طفل ، شاب … الخ.