داده گمشده (Missing data) چیست؟

داده گمشده (Missing data) چیست؟

داده گمشده[1] چیست؟

مشاهدات گمشده چالش مهمی را به دنبال دارد، زیرا پروسه های مدل بندی به راحتی این موارد را از تحلیل کنار می گذارند. هنگامی که این مقادیر گمشده اندک هستند (چیزی کمتر از 5 درصد از کل مشاهدات) و اگر بتوان گمشدگی آنها را بصورت تصادفی در نظر گرفت، یعنی گمشده ها به مقادیر دیگر بستگی نداشته باشند، آنگاه روش متداول حذف listwise روشی نسبتاً قابل اعتماد خواهد بود. پروسه ی Missing values علاوه بر اینکه می تواند ما را نسبت به استفاده از روش حذف listwise مطمئن گرداند، روش های دیگری نیز برای کار با داده های گمشده هنگامی که این روش معتبر نیست، ارائه می کند.

تحلیل Missing values مجموعه ای از ابزارهای نسبتاً متفاوت و روش های متنوعی از جانهی منفرد  را برای تحلیل داده های گمشده فراهم می آورد. یادآور می شویم که روش جانهی چندگانه (multiple imputation) به مراتب برتر از روش جانهی منفرد (single imputation) است.

تحلیل Missing Value

پروسه ی تحلیل Missing Value از سه دستورالعمل اولیه زیر پیروی می کند:

  • تشریح الگوی گمشدگی داده ها. اینکه مقادیر گمشده در کجا واقع شده اند؟ میزان گستردگی آنها تا چه اندازه است؟ آیا جفت متغیرهای یک مشاهده (Case) دارای مقادیر گمشده است؟ آیا این مقادیر گمشده در نقاط حدی (نقاط ابتدایی و انتهایی) واقع شده است؟ آیا گمشدگی بصورت تصادفی اتفاق افتاده است؟
  • برآورد میانگین ها، انحراف معیارها، کوواریانس ها و همبستگی ها برای روش های مختلف مقادیر گمشده (listwise, pairwise, regression, EM).
  • جانهی مقادیر گمشده با استفاده از برآورد این مقادیر با بهره از روش های رگرسیونی و الگوریتم EM.

تحلیل Missing Value به ما در مقابله با نگرانی هایی که بواسطه ی داده های ناکامل بوجود می آید کمک می کند. اگر مشاهدات دارای مقادیر گمشده بصورت منظم و سیستماتیک متفاوت از مشاهدات بدون گمشدگی باشند، نتایج گمراه کننده خواهد بود. گذشته از این داده های گمشده دقت محاسبات آماری را به دلیل از دست دادن پاره ای از اطلاعات کاهش می دهد. نگرانی دیگر، فرضیاتی است که در پشت هر پروسه ی آماری وجود دارد، زیرا اکثر این فرضیات تنها در خصوص مشاهدات کامل برقرار است و مقادیر گمشده نیازمند تئوری های پیچیده تری خواهد بود.

[1]Missing value


هیچ نظری تا کنون برای این مطلب ارسال نشده است، اولین نفر باشید...