نفس الأرقام ولكن الأشكال البيانية مختلفة ! كيف يمكن أن يحدث هذا ؟

كان هناك اعتقادا سائدا بين الإحصائيين والعلماء أن الأرقام أكثر دقة من الرسومات البيانية والتى قد تكون تقريبية..
فكانوا يقولون :
“Numerical calculations are exact, but graphs are rough”
إلى أن جاء عالم انجليزى اسمه فرانسيس أنسكومب عام 1973 وقلب هذا الاعتقاد رأسا على عقب عن طريق تقديم 4 مجموعات من البيانات من القيم x, y متطابقة من حيث الملخصات الرقمية:
لها نفس المجموع و المتوسط الحسابي والانحراف المعيارى ، ومعامل الارتباط ، ومعادلة الانحدار
Sum of x = 99
Sum of y = 82.51
Mean of x= 9
Standard deviation of x= 3.32
Mean of y = 7.5
Standard deviation of y= 2.03
Correlation between x and y =0.816
Linear regression line: y = 3 + 0.5x
ولكن عند عمل رسم بيانى لها تظهر الأشكال الأربعة فى الصورة التالية


مفاجأة غريبة .. ولكنها الحقيقة
الشكل البيانى مهم أيضا لعرض الداتا بنفس أهمية الملخصات الرقمية
والاختلاف هنا بين المجموعات الأربع يظهر الاختلاف فى العلاقة بين المتغيرين
فتظهر العلاقة بطريقة خطية فى المجموعة الأولى

linear relationship
بينما العلاقة غير خطية فى المجموعة الثانية

non-linear relationship
وفى المجموعة الثالثة العلاقة خطية ولكن توجد قيمة شاذة

one outlier point
أما فى المجموعة الرابعة فلا توجد علاقة بين المتغيرين ولكن هناك نقطة أدت لظهور معامل ارتباط عالى..
خلاصة الأمر أن الرسم البيانى مهم أيضا مثلما الأرقام مهمة.
وهذه صورة لقيم البيانات فى المجموعات الأربع.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s