آزمون ناپارامتری کروسکال-والیس و تحلیل در SPSS

آزمون ناپارامتری کروسکال-والیس و تحلیل در SPSS

گاه به دنبال مقایسه ی میانگین یک متغیر کمی در سطوح مختلف یک متغیر کیفی چند سطحی (بیش از دو سطح) هستیم. یعنی در این حالت یک متغیر کمی و یک متغیر کیفی چند سطحی داریم. به عنوان مثال زمانی که درصدد بررسی میانگین فشار خون در گروه های سنی مختلف (کمتر از 25 سال، 25 تا 45 سال، 45 تا 65 سال و بالاتر از 65 سال) هستیم، فشارخون متغیر کمی و گروه های سنی متغیر کیفی چند سطحی خواهند بود. تا زمانی که میانگین فشارخون از توزیع نرمال پیروی می کند، مقایسه ی میانگین ها از طریق آنالیز واریانس (ANOVA) امکان پذیر خواهد بود. مشکل زمانی رخ می دهد که متغیر کمی مورد بررسی ما نرمال نباشد. در این حالت به دلیل عدم برقراری فرض نرمال بودن که یکی از پیش فرض های استفاده از آنالیز واریانس به حساب می آید به سراغ آزمون ناپارامتری هم خانواده با ANOVA یعنی آزمون کروسکال والیس می رویم. آزمون های ناپارامتری بر خلاف آزمون های پارامتری نیازی به پیش فرض های اولیه ندارند ولی با این وجود این آزمون ها به مراتب ضعیف تر از روش های پارامتری عمل می کنند. لذا در صورت برقراری فرضیات مورد نیاز آزمون های پارامتری همیشه استفاده از این آزمون ها به آزمون های ناپارامتری ارجحیت دارد.

در آزمون کروسکال والیس مقایسه بین گروه ها از طریق مقایسه ی رتبه ها انجام می شود. به این صورت که ابتدا تمام مشاهدات (داده ها) بدون در نظر گرفتن گروهی که به آن متعلق هستند از 1 تا n (تعداد کل داده ها) رتبه بندی می شوند. سپس مشاهدات به گروه های خود می روند و درون هر گروه میانگین رتبه ها محاسبه می شود و نهایتاً این میانگین رتبه ها با یکدیگر مقایسه می گردند و ملاکی برای پذیرش یا عدم پذیرش فرضیه می باشند.

فرض صفر در این آزمون برابری میانگین رتبه ها و به عبارت کامل تر عدم اثر گذاری متغیر کیفی بر متغیر کمی می باشد (فرض مقابل یا فرض ادعای محقق: حداقل یکی از میانگین ها متفاوت از سایرین باشد). لذا رد فرض صفر بیانگر اثرگذاری متغیر کیفی بر متغیر کمی خواهد بود. در مثال فشار خون، اگر فرض صفر رد شود به این معناست که سن می تواند یک عامل موثر بر فشارخون به حساب آید و یا به عبارت دیگر میانگین فشار خون در رده های مختلف سنی برابر نمی باشد.

رد فرض صفر و پذیرش تفاوت بین گروه ها این سوال را بوجود می آورد که اختلاف دیده شده بین کدام گروه ها است؟ آیا تمام گروه ها با یکدیگر متفاوت بوده اند یا تنها یک گروه اختلاف معنادار با سایر گروه ها داشته است. به عنوان مثال، آیا میانگین فشار خون در تمام رده های سنی با یکدیگر اختلاف داشته است یا فقط یک رده ی سنی اختلاف فاحشی با سایر رده ها داشته است؟ اصلاً میانگین فشارخون کدام رده های سنی با یکدیگر متفاوت است؟

برای پاسخ به این سوال در تحلیل واریانس از پروسه ای با عنوان آزمون های جفتی post hoc استفاده می شد. اما در مورد آزمون ناپارامتری کروسکال والیس چه باید کرد؟ در ورژن های پایین تر spss امکان انجام مقایسات جفتی وجود نداشت و ما به ناچار برای انجام مقایسات زوجی به سراغ آزمون من ویتنی می رفتیم که البته روش درستی نبود. در spss ورژن 20 به بعد این امکان نیز تعبیه شده است که در ادامه به تفصیل و با ذکر مثال به آن می پردازیم.

 

مثال: محققی مدعی است سن یک عامل موثر بر فشارخون می باشد. برای این منظور اطلاعات فشار خون و سن (کمتر از 40، 40 تا 60، بالاتر از 60) 15 بیمار مورد بررسی قرار گرفت. اطلاعات این 15 نفر در محیط spss وارد شده است. ادعای این محقق را بررسی کنید.

 

- توجه داشته باشید قبل از اجرای پروسه می بایست ابتدا نرمالیتی متغیر فشار خون بررسی شود. ما قبلاً این مورد را بررسی کرده ایم

سپس از مسیر Analyz>Nonparametric tests>Independent samples وارد پنجره ی تحلیل می شویم. وارد برگه ی Field شده و در قسمت Test Fields متغیر کمی یعنی فشار خون و در قمست Groups متغیر کیفی چند سطحی یعنی سن را وارد کنید.

 

سپس وارد برگه ی Settings شوید. گزینه ی Customize را انتخاب و از کادر زیر آن آزمون کروسکال والیس را برگزینید. و سپس دکمه ی Run را بزنید.

 

در پنجره ی خروجی همانطور که مشاهده می کنید فرض صفر رده شده است که بیانگر اختلاف میانگین فشارخون در رده های سنی مختلف می باشد. اما اینکه اختلاف بین کدام رده های سنی وجود دارد بر ما مشخص نیست. برای این منظور در نرم افزار SPSS ورژن 20 این امکان فراهم شده است تا بتوانیم اختلافات زوجی را هم داشته باشیم. فقط یاد آور می شوم اختلافات زوجی در خروجی SPSS تنها زمانی نمایش داده می شود که فرض صفر رد شده باشد. برای دریافت اختلافات زوجی روی جدول Hypothesis Test Summary درمحیط SPSS دو بار کلیک کنید.

با دوبار کلیک پنجره ی زیر در خروجی نمایش داده میشود. در قمست انتهایی این پنجره جایی که مقابل View بصورت پیش فرض independent samples Test view را نمایش می دهد و یک امکان کرکره ای مانند می باشد. گزینه ی Pairwise Comparisons را انتخاب کنید.

در پنجره جدید مقایسات زوجی نمایش داده شده است. بر اساس جدول زیر و با توجه به مقادیر p-value یا همان Sig.، اختلاف معنادار در میانگین فشار خون بین رده های کمتر از 40 و بیشتر از60 و همچنین بین رده های 40 تا 60 و بیشتر از 60 دیده می شود. به عبارت بهتر اختلاف بین میانگین فشارخون تنها به رده ی سنی بیش از 60 سال مربوط است.


2 نظر

سپهر طایی
سپهر طایی  ۱۳۹۵/۰۸/۰۱ - ۱۸:۳۹:۵۴

سلام از مطالب ارایه شده بسیار سپاسگزارم. مطالب واقعا مفیدی بود.

پویا علامه
پویا علامه  ۱۳۹۶/۰۸/۱۴ - ۱۱:۰۰:۲۹

خیلی خوب آزمون کروسکال والیس را با رسم شکل توضیح دادید. با تشکر https://astat.ir/