استكشاف توزيع البيانات وكيفية التعامل مع القيم المتطرفة ومعالجتها وكيفية التعويض السليم
ฝัง
- เผยแพร่เมื่อ 23 พ.ย. 2024
- في هذا الدرس تم طرق موضوع هام جداً قبل اجراء اي تحليل للبيانات والذي يتناول اجرائية استكشاف البيانات لضمان سلامة ودقة النتائج فمن غير الجيد البدء بتحليل البيانات وهي لا تزال محتوية على قيم متطرفة ومن غير الجيد البدء مباشرة بتحليل البيانات دون معرفة ماهية هذه البيانات والى اين تتجه بنا القيم التي تحتويها فيجب اذن استكشاف البيانات قبل التحليل والتحقق من سلامتها ودقتها وانسجامها فيما بينها بشكل سليم وعلمي ودون تحيز من الباحث سواء كان تحيزاً مقصوداً او غير مقصود ان البيانات النظيفة هي التي تعطي نتائج سليمة يمكن على ضوئها اتخاذ قرارات دقيقة ولذلك فلابد من العناية بهذا الجانب والبدء بالتحقق من البيانات قبل التحليل والتحقق من سلامتها وانها لا تحتوي على قيم شاذة او مفقوده او خاطئة وهذا الخطاء في البيانات قد يكون لاسباب مختلفة منها كاحد الامثلة لا الحصر خطاء ادخال اثناء جمع البيانات بزيادة (اصفار) بجوار القيم المسجلة فبدلاً من ان يكتب (10) كتب (1000) فتصبح قيمة غير منسجمة مع بقية البيانات في ذلك السؤال الذي يفترض ان لا تتجاوز القيم المسجلة في عن (100) مثلاً وليكن سؤلاً عن العمر مثلاً وبالتالي فإن وجود شخص عمره (1000) عام هي قيمة خاطئة حتماً كانت اثناء الادخال فيجب التحقق من البيانات اذن بشكل عام في كل الاحوال قبل التحليل وكذلك تم توضيح كيفية معالجة القيم المتطرفة في حالة وجودها ضمن البيانات ولاهمية هذا الامر سواء في الابحاث او في المسوحات الميدانية فقد تناولته بتفصيل قدر المستطاع املاً من الله سبحانه وتعالى ان اكون قد وفقت في نقل المعلومة بشكل سلس ومبسط وباسلوب علمي دقيق
#التوزيع_الطبيعي
#استكشاف_توزيع_البيانات
#القيم_المتطرفة
محمد الآنسي
استشاري تحليل بيانات
يسعدني وضع استفساراتكم على الفيديو حتى اجيب عليها
كما يسعدني الرد على استفساراتكم على الواتس 773266234
شكرا على الشرح
العفو وشكرا على التعليق
شكرا استاذي
العفو
الك كل الشكر.
العفو
Nice
Thanks
شكرا لكم الشرح وافي ولكن عندي حاله في الاحصاء.. اريد استشيرك فيها.. كيف يمكن التواصل معكم
واتس 00967773266234
شكرا دكتور
عندي سؤال
هل لو البيانات اكتر من ٣٠٠ حاله
هل يمكن اعتبار البيانات تتبع التوزيع الطبيعي من غير الرجوع الأساليب الإحصائية
المهم ان تكون العينه ممثله للمجتمع تمثيلا صحيحا بغض النظر عن التوزيع الطبيعي انت ممكن تعمل عينه حتى 5 الف وتختبر توزيعها الطبيعي ويمكن يطلع انه مش توزيع طبيعي المهم هو ان تكون العينه ماخوذه من المجتمع بطريقه صحيحه تضمن تمثيله في العينه (تجانس) بين العينه والمجتمع من حيث التناسب في الاعداد
@@mohammedalanesi شكرا دكتور
السلام عليكم. انا بحلل الطلب على انحدار لوجستي متعدد. المتغيرات المستقله بدخلها لوحدها مع التابع بتطلع sig. ولما بدخل كل المستقلآت بتطلع. ٩٥١ sig. ايه الحل
وعليكم السلام. اكتفي بالمتغير المستقل الاساسي
انا اتبعت الطريقة ذاتها ولكن بقي التوزيع غير اعتدالي ماذا أفعل؟
استخدمي الاختبارات اللامعلميه مثلا بدل المتوسط استخدمي الوسيط ولكن خذي الوسيط المحسوب من مجموعه البيانات الوسطى وهكذا كل اجراء استخدمي بديله وبعدين شوفي لو النتيجه ما فرقت مع الإجراءات المعلميه يعني مثلا طلع معاكي المتوسط والوسيط بنفس المدى او الحدود الدنيا والعليا للاجابه اذا افترضنا انك تحسبيها لفقرات تتبع مقياس ليكارت فممكن تكتفي بالمتوسط هو ما يكون خطير الا اذا به فروق في الاجابه بين الاجراءات المعلميه واللامعلميه لو تعليقي واضح او تواصلي بالواتس وصوري خرج البيانات معك وبوضح لك اكثر