Correlation & Regression المفاهيم والاستخدامات

من المهم لأى دارس أو باحث أن يعرف الفرق بين هذين المصطلحين واستخداماتهما وألا يخلط بينهما

لنبدأ معا بموضوع الارتباط Correlation

يمكن من الاسم التخمين أنه يمثل العلاقة بين متغيرين، وتحديدا قوة واتجاه العلاقة.

Association between two variables

مثلا يمكننا القول أن هناك علاقة أو ارتباط بين طول الطفل ووزنه، ويمكننا أيضا أن نقول أن العلاقة إيجابية، أي أن الطول والوزن يزيدان معا، بينما قد تكون علاقة أخرى عكسية مثل العلاقة بين النشاط البدنى ومؤشر كتلة الجسم BMI

زيادة أحدهما يكون مصحوبا غالبا بنقص الآخر

 ويمكننا أن نعبر عن العلاقة بين المتغيرين برقم واحد، يزيد بزيادة قوة الارتباط، وتكون قيمته موجبة في العلاقة الإيجابية، وسالبة في العلاقة العكسية، وهذا الرقم نسميه معامل الارتباط أو correlation coefficient

تتراوح قيمة معامل الارتباط من -1 إلى 1 ، كلما اقتربنا من 1 أو -1 تكون العلاقة أكثر قوة، وكلما اقتربنا من الصفر تكون العلاقة ضعيفة أو معدومة.

مثال:

The correlation coefficient for children’s weight and height: r=0.85

The correlation is positive and strong

مثال آخر:

The correlation coefficient for physical activity and BMI: r= -0.4

The correlation is negative and moderate

مثال أخير:

The correlation coefficient for children’s weight and score in the exam: r=0.05

There is no correlation between children’s weight and score in the exam

ملاحظة هامة: وجود ارتباط بين عاملين لا يعنى أن أحدهما يسبب الآخر أو يؤثر في الآخر، أي أن الارتباط لا يعنى السببية، وتذكر الجملة الشهيرة:

correlation does not imply causation

ملاحظة أخرى: الارتباط بين المتغير س والمتغير ص ، هو نفسه الارتباط بين المتغير ص والمتغير س ، بمعنى:

Correlation of weight and height is equal to the correlation of height and weight

ملاحظة ثالثة: هناك نوعان شهيران من الارتباط Pearson’s correlation and Spearman’s correlation  

 يتشابهان في الغرض ويختلفان في الاستخدام

*****

والآن لننتقل للموضوع الآخر الذى يطلق عليه الانحدار Regression

إذا كان الارتباط correlation  يستخدم لوصف العلاقة بين متغيرين

فإن الانحدار Regression يقوم بحساب المعادلة الرياضية التي تصف تأثير أحد المتغيرين في المتغير الآخر

وبالتالي يمكن استخدام معادلة الانحدار في التنبؤ بهذا المتغير “التابع” والذى نطلق عليه dependent variable

ويمكننا تمثيل العلاقة بين المتغيرين بخط على الرسم البيانى يمثل العلاقة بينهما ولهذا الخط معادلة حسابية، تخبرنا بمقدار التغير الذى سيحدث في المتغير التابع إن حدث تغير في المتغير المستقل independent variable

لاحظ أن علاقة الانحدار بين س، ص تختلف عن علاقة الانحدار بين ص ، س ، الأمر مختلف ولابد من أخذ علاقة السببية في الاعتبار، أي من المتغيرين يؤثر في الآخر

الانحدار لا يقوم فقط باستخدام متغير واحد للتنبؤ بآخر ، بل إن الشائع هو استخدام أكثر من متغير للتنبؤ بمتغير واحد.

على سبيل المثال: يمكننا أن نستخدم قياس السكر في الدم أثناء الصيام للتنبؤ بمستوى الهيموجلوبين السكرى

Using fasting blood glucose to predict HbA1c level

وقد تكون المعادلة مثلا

HBA1c = 3.2+ (0.45*Blood glucose)

الاستخدام الأشهر للانحدار هو التنبؤ، وهو الأمر الذى ينبنى عليه تطبيقات واستخدامات كثيرة جدا في علوم البيانات والذكاء الصناعى

بينما يستخدم في الأبحاث الطبية أيضا لغرض آخر هام، ألا وهو :

Controlling for other variables

بمعنى أننى قد أجرى أحد البحوث الطبية لدراسة العلاقة بين التدخين و مشاكل الشرايين التاجية، هذه العلاقة قد تتأثر بعوامل أخرى كثيرة مثل الجنس ، العمر، شرب القهوة، طبيعة العمل، تناول الكحول، وجود مرض السكرى .. الخ

وللوصول إلى علاقة دقيقة بين التدخين ومشاكل الشرايين التاجية، نحتاج لاستخدام نموذج انحدار أو regression model

يحتوى على كل هذه العوامل السابق ذكرها.

أنواع الانحدار التي نراها غالبا في الأبحاث الطبية تعتمد على المتغير التابع الذى نقوم بالتنبؤ به أو دراسة تأثير العوامل الأخرى عليه dependent variable

وأشهر هذه الأنواع هي:

Linear regression: for continuous dependent variable, e.g. HBA1c

ويستخدم إذا كان المتغير الذى نتنبأ به متغير رقمى، مثل مستوى أحد المركبات الكيميائية في الدم، أو ضغط الدم، الخ

Logistic regression: for binary variables, e.g. Yes/No, Diseased/Not diseased

نستخدمه في حالة كون المتغير الذى نتنبأ به متغير من مستويين مثل وجود المرض أو عدمه ، أو حدوث الوفاة أو لا.

Cox regression: for survival analysis where the outcome is time to certain event, e.g. time to recurrence

نستخدمه في نوع خاص من الدراسات، والتي تقيس الزمن حتى حدوث حدث معين، مثل الزمن حتى الوفاة، أو الزمن حتى رجوع السرطان

ملاحظة أخيرة: أنواع الانحدار أكثر وأعمق وحساباته أيضا معقدة، أردنا هنا أن نعطى فكرة سطحية مبسطة عن الموضوع.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s