
من المهم لأى دارس أو باحث أن يعرف الفرق بين هذين المصطلحين واستخداماتهما وألا يخلط بينهما
لنبدأ معا بموضوع الارتباط Correlation
يمكن من الاسم التخمين أنه يمثل العلاقة بين متغيرين، وتحديدا قوة واتجاه العلاقة.
Association between two variables
مثلا يمكننا القول أن هناك علاقة أو ارتباط بين طول الطفل ووزنه، ويمكننا أيضا أن نقول أن العلاقة إيجابية، أي أن الطول والوزن يزيدان معا، بينما قد تكون علاقة أخرى عكسية مثل العلاقة بين النشاط البدنى ومؤشر كتلة الجسم BMI
زيادة أحدهما يكون مصحوبا غالبا بنقص الآخر
ويمكننا أن نعبر عن العلاقة بين المتغيرين برقم واحد، يزيد بزيادة قوة الارتباط، وتكون قيمته موجبة في العلاقة الإيجابية، وسالبة في العلاقة العكسية، وهذا الرقم نسميه معامل الارتباط أو correlation coefficient
تتراوح قيمة معامل الارتباط من -1 إلى 1 ، كلما اقتربنا من 1 أو -1 تكون العلاقة أكثر قوة، وكلما اقتربنا من الصفر تكون العلاقة ضعيفة أو معدومة.
مثال:
The correlation coefficient for children’s weight and height: r=0.85
The correlation is positive and strong
مثال آخر:
The correlation coefficient for physical activity and BMI: r= -0.4
The correlation is negative and moderate
مثال أخير:
The correlation coefficient for children’s weight and score in the exam: r=0.05
There is no correlation between children’s weight and score in the exam
ملاحظة هامة: وجود ارتباط بين عاملين لا يعنى أن أحدهما يسبب الآخر أو يؤثر في الآخر، أي أن الارتباط لا يعنى السببية، وتذكر الجملة الشهيرة:
“correlation does not imply causation“
ملاحظة أخرى: الارتباط بين المتغير س والمتغير ص ، هو نفسه الارتباط بين المتغير ص والمتغير س ، بمعنى:
Correlation of weight and height is equal to the correlation of height and weight
ملاحظة ثالثة: هناك نوعان شهيران من الارتباط Pearson’s correlation and Spearman’s correlation
يتشابهان في الغرض ويختلفان في الاستخدام
*****
والآن لننتقل للموضوع الآخر الذى يطلق عليه الانحدار Regression
إذا كان الارتباط correlation يستخدم لوصف العلاقة بين متغيرين
فإن الانحدار Regression يقوم بحساب المعادلة الرياضية التي تصف تأثير أحد المتغيرين في المتغير الآخر
وبالتالي يمكن استخدام معادلة الانحدار في التنبؤ بهذا المتغير “التابع” والذى نطلق عليه dependent variable
ويمكننا تمثيل العلاقة بين المتغيرين بخط على الرسم البيانى يمثل العلاقة بينهما ولهذا الخط معادلة حسابية، تخبرنا بمقدار التغير الذى سيحدث في المتغير التابع إن حدث تغير في المتغير المستقل independent variable
لاحظ أن علاقة الانحدار بين س، ص تختلف عن علاقة الانحدار بين ص ، س ، الأمر مختلف ولابد من أخذ علاقة السببية في الاعتبار، أي من المتغيرين يؤثر في الآخر
الانحدار لا يقوم فقط باستخدام متغير واحد للتنبؤ بآخر ، بل إن الشائع هو استخدام أكثر من متغير للتنبؤ بمتغير واحد.
على سبيل المثال: يمكننا أن نستخدم قياس السكر في الدم أثناء الصيام للتنبؤ بمستوى الهيموجلوبين السكرى
Using fasting blood glucose to predict HbA1c level
وقد تكون المعادلة مثلا
HBA1c = 3.2+ (0.45*Blood glucose)
الاستخدام الأشهر للانحدار هو التنبؤ، وهو الأمر الذى ينبنى عليه تطبيقات واستخدامات كثيرة جدا في علوم البيانات والذكاء الصناعى
بينما يستخدم في الأبحاث الطبية أيضا لغرض آخر هام، ألا وهو :
Controlling for other variables
بمعنى أننى قد أجرى أحد البحوث الطبية لدراسة العلاقة بين التدخين و مشاكل الشرايين التاجية، هذه العلاقة قد تتأثر بعوامل أخرى كثيرة مثل الجنس ، العمر، شرب القهوة، طبيعة العمل، تناول الكحول، وجود مرض السكرى .. الخ
وللوصول إلى علاقة دقيقة بين التدخين ومشاكل الشرايين التاجية، نحتاج لاستخدام نموذج انحدار أو regression model
يحتوى على كل هذه العوامل السابق ذكرها.
أنواع الانحدار التي نراها غالبا في الأبحاث الطبية تعتمد على المتغير التابع الذى نقوم بالتنبؤ به أو دراسة تأثير العوامل الأخرى عليه dependent variable
وأشهر هذه الأنواع هي:
Linear regression: for continuous dependent variable, e.g. HBA1c
ويستخدم إذا كان المتغير الذى نتنبأ به متغير رقمى، مثل مستوى أحد المركبات الكيميائية في الدم، أو ضغط الدم، الخ
Logistic regression: for binary variables, e.g. Yes/No, Diseased/Not diseased
نستخدمه في حالة كون المتغير الذى نتنبأ به متغير من مستويين مثل وجود المرض أو عدمه ، أو حدوث الوفاة أو لا.
Cox regression: for survival analysis where the outcome is time to certain event, e.g. time to recurrence
نستخدمه في نوع خاص من الدراسات، والتي تقيس الزمن حتى حدوث حدث معين، مثل الزمن حتى الوفاة، أو الزمن حتى رجوع السرطان
ملاحظة أخيرة: أنواع الانحدار أكثر وأعمق وحساباته أيضا معقدة، أردنا هنا أن نعطى فكرة سطحية مبسطة عن الموضوع.