كان هناك اعتقادا سائدا بين الإحصائيين والعلماء أن الأرقام أكثر دقة من الرسومات البيانية والتى قد تكون تقريبية..
فكانوا يقولون :
“Numerical calculations are exact, but graphs are rough”
إلى أن جاء عالم انجليزى اسمه فرانسيس أنسكومب عام 1973 وقلب هذا الاعتقاد رأسا على عقب عن طريق تقديم 4 مجموعات من البيانات من القيم x, y متطابقة من حيث الملخصات الرقمية:
لها نفس المجموع و المتوسط الحسابي والانحراف المعيارى ، ومعامل الارتباط ، ومعادلة الانحدار
Sum of x = 99
Sum of y = 82.51
Mean of x= 9
Standard deviation of x= 3.32
Mean of y = 7.5
Standard deviation of y= 2.03
Correlation between x and y =0.816
Linear regression line: y = 3 + 0.5x
ولكن عند عمل رسم بيانى لها تظهر الأشكال الأربعة فى الصورة التالية

مفاجأة غريبة .. ولكنها الحقيقة
الشكل البيانى مهم أيضا لعرض الداتا بنفس أهمية الملخصات الرقمية
والاختلاف هنا بين المجموعات الأربع يظهر الاختلاف فى العلاقة بين المتغيرين
فتظهر العلاقة بطريقة خطية فى المجموعة الأولى
linear relationship
بينما العلاقة غير خطية فى المجموعة الثانية
non-linear relationship
وفى المجموعة الثالثة العلاقة خطية ولكن توجد قيمة شاذة
one outlier point
أما فى المجموعة الرابعة فلا توجد علاقة بين المتغيرين ولكن هناك نقطة أدت لظهور معامل ارتباط عالى..
خلاصة الأمر أن الرسم البيانى مهم أيضا مثلما الأرقام مهمة.
وهذه صورة لقيم البيانات فى المجموعات الأربع.
