Confidence Interval دليلك المبسط للفهم الصحيح

سنفترض أنك كباحث أردت أن تعرف متوسط وزن الطلبة في إحدى الجامعات ، وحيث أنك لن تقوم بقياس وزن كل الطلبة ، فقد قمت بأخذ عينة عشوائية مكونة من 50 طالب وقمت بقياس وزنهم وحساب المتوسط الحسابي mean

ولنفترض أن الرقم الذى حصلت عليه هو 70 كجم ، وهو معبر بشكل أو بآخر عن وزن طلاب هذه الجامعة

ولكن ..

لو افترضنا أننا قمنا بقياس فعلى لوزن كل طالب من طلاب الجامعة فهل سنحصل على النفس النتيجة؟

ربما نعم ، وغالبا لا ..

لو افترضنا أننا أخذنا عينة أخرى فقد نحصل على نفس النتيجة وقد لا نحصل عليها ..

إذن قيامنا بأخذ عينة، وحساب المتوسط الحسابي فنحن لسنا واثقين تماما من أن هذا الرقم يعبر تماما عن كل الطلبة..

ما رأيك لو أخذنا بدلا من هذا الرقم الوحيد مجالا من الأرقام له حد أكبر وحد أدنى ، ونقول أننا واثقون إلى درجة معينة من أن المتوسط الحسابي لكل الطلبة يقع بين هذين الرقمين ، وليكن مثلا 65 و 75 كجم

ربما يكون التعبير عن وزن الطلبة بهذه الطريقة أكثر إفهاما للقارىء .. وهذا المجال هو ما نسميه مجال الثقة أو Confidence Interval

ونختصرها في كثير من الأحيان إلى CI

ولكن انتبه ، نحن لا نتحدث عنها في المطلق ، ولكن لا بد أن تصحبها نسبة مئوية تعبر عن درجة الثقة التي نتحدث عنها ، وبالتالي تكون مثلا : 90%CI , 95% CI, 99% CI

فنقول مثلا:

95% CI of students’ mean weight is 65, 75 kg

بمعنى أننا لو كررنا التجربة عدد كبير أو لا نهائي من المرات فإن متوسط وزن طلبة الجامعة سيكون بين هذين الرقمين في 95% من المرات

ويمكن تفسيرها بالطريقة التالية:

We are 95% confident that the true population mean (mean of all university students weight) lies between 65 and 75 kg

لذا يكون التفسير هو أننا متأكدون بنسبة 95% من أن متوسط الوزن (الصحيح)  لكل الطلبة يقع في هذا النطاق.

قد يحدث أن تجد أحدهم يفسرها بطريقة أخرى :

There is a 95% probability that the true population mean (mean of all university students) lies between 65 and 75 kg

ولكن انتبه: هذا التفسير هو خطأ شائع يقع فيه الكثيرون.

إذا كانت فكرة الموضوع واضحة حتى الآن ، يمكننا إضافة بعض المعلومات التي تعمق الفهم ..

  1. لو افترضنا أننا أخذنا عينة مكونة من 500 طالب بدلا من 50 طالب، في هذه الحالة نتوقع أن تكون النتيجة التي حصلنا عليها أكثر دقة ، وأقرب للرقم الحقيقي الذى نبحث عنه ، وبالتالي ستكون ال confidence interval  أضيق ، ولتكن مثلا 68 و 72
  2. بينما لو أننا كنا أثر تساهلا ، فأردنا مثلا الحصول على 90%CI  بدلا من 95%CI   في هذه الحالة نتوقع أن تكون ال confidence interval  أضيق ، لأننا سمحنا بهامش خطأ أكبر

ملاحظة : لو كنا نحسب confidence interval  للفارق بين مجموعتين مثلا ، واحتوت هذه الفترة على الرقم صفر ، فكانت مثلا بين -2 و 8 ، هذا يعنى أنه ربما يكون الفارق بين المجموعتين صفرا ، وبالتالي قد لا يكون هناك فارق ذو دلالة إحصائية بين المجموعتين.

وهناك حالة خاصة نبحث فيها عن إذا ما كانت ال confidence interval  تحتوى على الرقم 1 وليس الرقم صفر ،  وهى حالة ال OR, RR

حيث أنها تمثل نسبة بين مجموعتين ، ومعنى كون قيمتها =1 هو عدم وجود فارق بين المجموعتين

الخلاصة :

Interpretation of 95%CI : we are 95% confident that the true population mean lies between …. & ….

As the sample size increases, the confidence interval is narrower

If we want more precise confidence level (for example 99% instead of 95%), the CI will be wider

2 thoughts on “Confidence Interval دليلك المبسط للفهم الصحيح

  1. بينما لو أننا كنا أثر تساهلا ، فأردنا مثلا الحصول على 90%CI بدلا من 95%CI في هذه الحالة نتوقع أن تكون ال confidence interval أضيق ، لأننا سمحنا بهامش خطأ أكبر(

    أعتقد أن ال CI ستكون أوسع وليس أضيق

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s