آزمون کای اسکوئر (chi-square)

آزمون کای اسکوئر (chi-square)

آزمون  آماری کای اسکوئر یا Chi-Square (کای دو، خی دو) یکی از شایعترین آزمونهای آماری سطح مقدماتی است که در تعداد زیادی از مقالات مشاهده می کنیم از این آزمون استفاده شده است.

دراین مطلب قصدم این نیست که به روش اجرای این آزمون بپردازم و یا روش محاسبه دستی یا روش اجرای این آزمون بر روی نرم افزار SPSS را بیاموزم, چرا که چنین مطالبی در کتب به وفور آموزش داده شده است.

با  اینحال من احساس می کنم که عمده پژوهشگرانی که از این تست آماری استفاده می کنند احتمالا در ذهنشان یکسری ابهاماتی در مورد علی الخصوص ا نواع این تست و مکانهایی که هر یک از انواع این تست قابل استفاده است وجود دارد که دراین مطلب کوتاه تنها قصدم رفع ابهام درمورد همین ابهامات احتمالا مهم و احتمالا بسیار شایع است.

پر گویی نمی کنم و به اصل مطلب می پردازم.

یکی از ابهامات اصلی درمورد این آزمون این است که این آزمون بردو نوع می باشد که هر کدام کاملا متفاوت بوده و هایپوتزهایی که در آن آزمونها به آزمایش گذارده می شود کاملا متفاوت ازهمدیگر است. بنابر ا ین در اینجا دو نوع آزمون کای اسکوئر را معرفی می کنم:

xx1: Goodness-of-fit

xx2: Test of independence

 

در تست نوع اول (گودنس آو فیت), پژوهشگر اقدام به آزمون فرضیه مشخصی درمورد توزیع یک متغیر می باشد. درحالیکه در تست نوع دوم ( تست آو ایندپندنس ), پژوهشگر بدنبال آزمودن هایپوتز وجود Association بین دو متغیربراساس جدول Contingency table  است.

برای روشن شدن موضوع, مثالهایی می زنم:

مثال اول.

فرض کنیم که پزشک پژوهشگری در یک مرکز ترک اعتیاد کار و پژوهش می کند. ایشان بعد از یک سال کار دراین مرکز و تجربیات گرانبهایی که در برخورد با یکایک این معتادان و فرایند ترک اعتیاد آنها بدست آورده است, احتمالا یکسری پیش فرضهایی در ذهنش درارتباط با این جامعه یا Population که همان مراجعه کنندگان معتاد به این کلینیک ترک اعتیاد می باشد رسیده است. یکی از این پیش ذهنیتها این است که ایشان ممکن است فکر کند احتمالا مراجعه کنندگان به این کلینیک بصورت یکسان و یکنواخت در بین گروه های سنی مختلف پخش نشده اند. بنابراین در ذهن ایشان سوال پژوهش یا Research question ای به شکل زیر بوجود می آید:

Is the proportion of addicts admitted to the clinic different by age group ?x

 

بنابراین این پزشک و پژوهشگر ما که حالا یک سوال پژوهش مهم در ذهنش ایجاد شده است, تصمیم می گیرد که پژوهشی بر روی مراجعه کنندگان به این مرکز ترک اعتیاد انجام بدهد و در ان پژوهش به پاسخ سوال فوق برسد. بنابراین اگر از ایشان بپرسند که هدف اختصاصی یا Specific objective ایشان در این پژوهش چه بوده است, ایشان پاسخ خواهد داد:

The aim of the proposed research is to determine the difference between the proportions of addicts admitted to the clinic by age groups.x

 

سپس از ایشان می پرسیم که خوب, حالا که سوال پژوهشت مشخص شد و هدف اختصاصی از این پژوهش را هم نوشتی, حالا برای رسیدن به پاسخ آن سوال پژوهش و یا رسیدن به این هدف اختصاصی فوق الذکر چه کار می خواهی بکنی؟ ایشان در جواب پاسخ خواهد داد که قصد دارد تا هایپوتز متناظر با هدف پژوهش و سوال پژوهش فوق را در یک پژوهش از نوع Cross sectional بیازماید. از ایشان می پرسیم که هایپوتز شما چیست؟ ایشان می گوید هایپوتز پژوهش من یا Research hypothesis , که از آن تحت عنوان Alternative hypothesis هم نام برده می شود به شکل زیر تدوین شده است:

The proportion of addicts admitted to the clinic is different by age group.x

 

و نهایتا از ایشان می پرسند که شما چطور می خواهید چنین هایپوتزمشکلی را آزمایش کنید؟ ایشان هم می گوید بجای آنکه این هاهیپوتز بسیار مشکل را بیازماید, می رود و هایپوتز دیگری را که همین عبارت را بصورت خنثی یا Null بیان کرده باشد می آزماید و اگر بتواند آن هایپوتز خنثی را که ما در اینجا به آن Null Hypothesis  می گوییم رجکت کند ( که رجکت کردن یک هایپوتز خنثی خیلی خیلی ساده تر است ) ,در آنصورت مستنداتی و یا شواهدی به نفع هایپوتز پژوهش خود بدست آورده است.

توجه بفرمایید که دراینجا من نگفتم که هایپوتز پژوهش را تایید کرده است چون این کار عملا درعالم واقعیت نا ممکن است, بلکه من اشاره کردم که ایشان شواهدی در تایید هایپوتز پژوهش به دست آورده است ولی نه در تایید صد درصد آن هایپوتز. بنابراین ایشان می آید و هایپوتزی را که در عمل قرار است در پژوهش مورد نظربیازماید و هایپوتز خنثی می باشد را به شکل زیر معرفی می کند:

The proportion of addicts admitted to the clinic is the same for all age groups.x

 

بعد از این مرحله, از پژوهش می پرسیم که حالا این هایپوتز را با کدام آزمون می خواهی بیازمایی؟ ایشان هم به درستی پاسخ می دهد با استفاده از Goodness-of-fit که یکی از دو نوع آزمون کای اسکوئر است این هایپوتز را می آزمایم. به این صورت که جدولی طراحی می کنم و در دسته های مختلف سنی می آیم و تعداد ( فرکانس ) مراجعه کنندگان مربوط به هر دسته سنی را به کلینیک در داخل جدول قرار میدهم (Observed  ) و همزمان تعداد پیش قابل انتظار را هم در جدول قرار میدهم و محاسباتم را انجام می دهم.

نهایتا ممکن است که ایشان برود و آنالیز آماری را درسطح سیگنیفیکانس برابر با پنج صدم بیازماید و به نتیجه زیر برسد:

The proportion of addicts admitted to the clinic is significantly different by age group at 0.05 level of significance.x

 

بنابراین نکته خیلی مهمی که دراینجا به عنوان نتیجه بحث بر روی نوع اول از تست کای اسکوئر می گیریم این است که ما در اینجا فقط یک متغیر داریم و نه دو متغیر. بنابراین اشتباه خواهد بود که اگر هایپوتزهای این پژوهش و یا سوالات پژوهش و یا ابجکتیوهای این پژوهش و یاعنوان مقاله ای که بعدا از آن پژوهش تولید می کنیم را طوری به اشتباه نگارش کنیم که گویا درحال آزمودن ارتباط بین دو متغیر بوده ایم.

حالا دراینجا به نوع دوم تست کای اسکوئر می پردازم و این نوع دوم برخلاف نوع اول نوعی است که در آن با دو متغیر سروکار داریم و اتفاقا دراین تست ما قرار است که ارتباط  از نوع Association بین دو متغیر را که هر کدام از این دو متغیر می تواند Nominal و یا Ordinal باشد, بیازماییم.

تفاوت دیگری که در این نوع دوم از تست کای اسکوئر داریم این است که ما بعد از آزمودن هایپوتز فوق الذکر,بزرگی Association بین دو متغیر را هم با استفاده از شاخص هایی نظیر Phi Coefficient  و یا Contingency Coefficient , و یا Cramer’s V Coefficient پرزانته خواهیم کرد.

 

پس نکته مهم در این نوع دوم از تست کای اسکوئر این است که ما اولا با دو متغیر سروکار داریم و دوما آنکه Association بین دو متغیر و یا بعبارتی Independence بین دو متغیر را می آزماییم و نه آنکه بخواهیم بمانند نوع اول Proportion و یا Distribution را بررسی کنیم. و سوما اینکه درانتهای کار هم خواهیم آمد و بزرگی یا Magnitude اندازه این Association را هم براساس قانون شست انگشت گیلفورد یا Gilford’s rule of thumb تفسیر خواهیم کرد.

البته تا فراموش نکردم حتما باید یادآوری کنم و البته نیاز به یادآوری من هم نخواهد بود که سوالهای پژوهش , ابجکتیوهای اختصاصی پژوهش و نیز هایپوتز پژوهش و هایپوتز خنثی, همه بصورتی کاملا واضح متفاوت با آن چیزی است که در نوع اول از تست کای اسکوئر در مثال اول در بالا به تفصیل شرح داده ام.

بصورت خلاصه, در این نوع دوم از تست کای اسکوئر ما دو متغیرVariable Independent یا IV و Dependent variable یا DV را داریم که در هایپوتز این پژوهش قصد خواهیم داشت که فرضیه ای را که می گوید متغیرDV  ما کلا Independent از متغیر IV است ( فرضیه خنثی ) را به نفع فرضیه آلترناتیو پژوهش مان بیازماییم. بطور خلاصه, هایپوتز پژوهش دراین نوع از آزمون کای اسکوئر به شکل زیر خواهد بود:

Dependent variable is dependent on independent variable

 

و هایپوتز نال متناظر با این هایپوتز را که قرار است در آزمون آماری مان بیازماییم هم به شکل زیر خواهد بود:

Dependent variable is independent of independent variable

 

 

تهیه و تنظیم: دکترمهرداد جلالیان

منبع: http://www.getpaper.ir/


1 نظر

ملوک رویان
ملوک رویان  ۱۳۹۶/۱۰/۱۰ - ۰۲:۵۵:۵۹

سلام خدمت شما. وقت شما بخیر. مطلب شما مفید بود ولی برای بنده که رشته ام آمار نیست و نیاز به یادگیری با زبان ساده تر داشتم، سخت بود. بازم متشکرم از مطلب شما.